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出 版 者 的 话 


21 世纪 是 生命 科学 的 世纪 ， 这 已 成 为 人 们 的 共识 ， 

生命 科学 随 着 人 类 对 自身 和 自然 的 认识 、 探 索 而 萌芽 ， 随 着 人 类 生产 和 科学 实践 
的 进步 而 发 展 。 现 代 生 命 科 学 包括 生物 学 、 医 学 、 农 学 等 传统 学 科 领 域 以 及 生物 学 、 
生物 技术 与 环境 科学 万 至 社会 科学 等 其 他 学 科 相 互 渗透 、 交 叉 而 产生 的 新 型 学 科 体系 。 
20 世纪 后 叶 现 代 生 物 科 学 尤其 是 分 子 生 物 学 取得 了 一 系列 突破 性 成 就 , 使 得 生命 科学 
在 自然 科学 体系 中 的 位 置 发 生 了 革命 性 的 变化 , 成 为 21 世纪 的 带头 学 科 。 人 们 对 生命 
科学 也 寄予 了 无 限 的 期 望 ， 和 希望 能 够 解决 人 类 社会 所 面临 的 人 口 膨 胀 、 资 源 匮 乏 、 疾 
病危 害 、 环 境 污染 和 生态 破坏 等 一 系列 重大 问题 . 

回顾 生命 科学 的 发 展 历程 ， 实 验 技术 一 直 起 着 非常 重要 的 促进 作用 。 如 17 世纪 
Leeuwenhoek 等 人 发 明 并 应 用 显微镜 技术 ， 直 接 催生 了 “细胞 学 说 ” 的 建立 和 发 展 ， 
1973 年 Cohn 和 Boyer 完成 了 DNA 体外 重组 实验 ， 标 志 着 基因 工程 的 秘 始 1988 年 
Kary Mullis 发 明 的 PCR 技术 其 至 使 生命 科学 产生 了 飞 唉 性 的 发 展 ,可 以 说 , 生命 科学 
无 时 无 刻 离 不 开 实 验 ， 实 验 是 开启 神奇 的 生命 王国 大 门 的 钥匙 。 没 有 实验 技术 的 不 册 
进步 ， 也 就 没有 生命 科学 今天 的 巨大 发 展 ， 同 时 ， 生 命 科 学 的 发 展 又 对 实验 技术 提出 
了 更 高 的 要 求 ， 进 一 步 刺 激 了 后 者 的 不 断 进 步 。 生 命 科 学 正 是 在 “实验 催生 和 验证 着 
基础 理论 ， 理 论 指 导 和 发 展 了 实验 技术 ”的 不 断 循 环 中 从 必然 王国 走向 自由 王国 。 

工 欲 善 其 事 ， 必 先 利 其 器 。 为 了 有 助 于 生命 科学 工作 者 更 多 地 了 解 相 关 实 验 技术 
和 仪器 设备 ， 更 好 地 设计 实验 方案 ， 更 有 效 地 开展 实验 过 程 ， 更 合理 地 处 理 实验 结果 ， 
化 学 工业 出 版 社 组 织 出 版 了 “生物 实验 室 系列 ” 图书。 系列 图 书 在 整体 规划 的 基础 上 ， 
本 着 “经 典 、 前 沿 、 实 用 ， 理 论 与 技术 并 重 ”的 原则 组 织 编 写 ， 分 批 出 版 。 
和 于 题材 上 ， 系列 图 书 涵盖 综合 实验 技术 和 单项 实验 技 . 两 个 方面 。 其 中 综合 实验 
技术 既 有 以 实验 目的 为 题 ， 如 “蛋白 质 化 学 分 析 技 术 ”， 内 容 纵向 覆盖 多 项 实验 技术 ; 
电 有 以 某 一 生命 学 科 领 域 的 综合 实验 技术 为 题 ， 如 “发 酵 工 程 实验 技术 ”、“ 生 物化 学 
实验 技术 ”等 。 而 单项 实验 技术 则 以 深入 介绍 某 一 专项 技术 及 其 应 用 为 主 ， 在 阐述 其 
基本 原理 的 基础 上 ， 模 向 介绍 该 项 技术 在 多 个 领域 的 应 用 ， 如 “双向 电泳 技术 ”、" 流 
式 细胞 术 ” 等 。 

在 内 容 上 ， 系 列 图 书 主要 有 以 下 两 个 显著 特点 。 一 是 强调 先进 性 一 一 除了 系统 介 
绍 常用 和 经 典 实 验 技术 以 外 ， 特 别 突出 了 当前 该 领域 实验 手段 的 新 理论 、 新 技术 、 新 
发 展 ， 为 国内 专业 人 员 起 到 借鉴 和 引导 作用 。 二 是 强调 可 操作 性 一 一 对 于 每 一 项 实验 
技术 ， 系 统 介绍 其 原理 方法 、 设 备 仪器 和 实验 过 程 ， 让 读者 明了 实验 的 目的 、 沪 案 设 
计 以 及 具体 步骤 和 结果 处 理 ， 以 期 起 到 实验 指南 的 作用 ， 

本 系列 图 书 坚持 质量 为 先 ， 开 拓 国 内 和 国际 两 个 出 版 资源 。 一 方面 ， 约 请 国内 相 
关 领 域 兼 具 理论 进 放 和 丰富 实验 室 工作 经 验 的 专家 学 者 编著 ; 另 一 方面 ， 时 刻 关注 国 
际 生命 科学 前 沿 领域 和 先进 技术 的 进展 ， 及 时 引进 (翻译 或 影印 ) 国外 知名 出 版 社 的 


权威 力作 . 

《生物 实验 室 系列 》 图 书 的 读者 对 象 设 定 为 国内 从 事 生命 科学 及 生物 技术 和 相关 
领域 (如 医学 、 药 学 、 农 学 ) 的 专业 研究 人 员 ， 企 业 或 公司 的 生产 、 研 发 、 管 理 技术 
人 员 ， 以 及 高 校 相关 专业 的 教师 、 研 究 生 等 

我 们 服 切 希望 《生物 实验 室 系 列 》 图 书 的 出 版 能 够 服务 于 我 国生 命 科学 的 发 展 需 
要 ， 同 时 热忱 欢迎 从 事 和 关心 生命 科学 的 广大 科技 人 员 不 仅 能 对 已 出 版 图 书 提供 宝贵 
意见 和 建议 ， 也 能 对 系列 图 书 的 后 续 题目 设计 贡献 良策 或 推荐 作者 ， 以 便 我 们 能 够 集 
思 广 益 ， 将 这 一 系列 图 书 沿 着 可 持续 发 展 的 方向 不 断 丰 富 品种 ， 推 式 出 新 ， 


谨 向 所 有 关心 和 热爱 生命 科学 ， 为 生命 科学 的 发 展 孜 孜 以 求 的 科学 工作 者 致 以 崇 
高 的 敬意 ! 
祝愿 我 国 的 科技 事业 如 生命 之 树 根深 时 茂 ， 欣 砍 向 荣 ! 


化 学 工业 出 版 社 
生物 ， 医 药 出 版 分 社 
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蛋白 质 是 一 切 生 物 借以 表现 生命 的 最 重要 的 基本 单元 ， 是 自然 界 存 在 的 小 型 的 自 
动机 器 。 任 何 一 个 生命 体 的 繁衍 、 新 陈 代 谢 、 运 动 等 ， 都 需要 数 十 亿 个 蛋白 质 分 子 的 
协调 行动 才能 得 以 顺利 进行 。 随 着 人 类 功能 基因 组 研究 的 展开 ， 科 学 家 对 于 基因 的 研 
究 焦 点 ,已 由 基因 测序 转移 到 基因 表达 产物 一 一 和 蛋白质 上 . 为 了 执行 特定 的 生物 功能 ， 
每 一 个 蛋白 质 分 子 都 有 一 个 独特 的 三 维 结构 。 研 究 蛋 白质 的 结构 ， 有 助 于 了 解 蛋白 质 
的 功能 ， 了 解 蛋 白质 的 作用 机 制 以 及 了 解 蛋 白质 与 其 他 分 子 之 间 的 相互 作用 。 对 于 全 
新 或 功能 未 知 的 蛋白 质 分 子 ， 通 过 结构 分 析 ， 可 以 进行 功能 诠释 ， 指 导 设 计生 物 学 实 
验 来 进行 功能 研究 。 通 过 分 析 蛋 白质 的 结构 ， 确 认 功 能 位 点 ， 为 设计 新 的 蛋白 质 或 改 
造 蛋 白质 提供 可 靠 的 依据 。 到 目前 为 止 , 确定 蛋白 质 三 维 结构 的 方法 主要 分 为 两 大 类 ， 
其 一 是 利用 实验 的 方法 来 测定 ; 其 二 则 是 利用 计算 机 技术 ， 根 据 现 有 理论 和 已 知 的 序 
列 等 信息 进行 蛋白 质 的 结构 预测 。 测 定 蛋 白质 三 维 结构 的 方法 分 为 三 大 类 : (1) ХА 
线 晶体 衍射 图 谱 法 ，(2 ) 核磁 共振 方法 ，(3 ) 电镜 方法 。 

近年 来 分 子 生物 学 的 快速 发 展 使 蛋白 质 序列 数据 库 的 数据 量 得 到 快速 增长 。 而 利 
用 实验 方法 测定 蛋白 质 三 维 结构 则 由 于 耗 时 长 、 成 本 高 以 及 方法 在 技术 上 的 困难 ， 而 
是 解 析 的 蛋白 质 结构 比 已 知 的 蛋白 质 序 列 要 少 得 多 。 另 一 方面 ， 随 着 DNA 测序 技术 
的 发 展 , 人 类 基因 组 及 更 多 的 模式 生物 基因 组 将 被 完全 测序 ,DNA 序列 数量 将 会 急 增 ， 
由 于 DNA 序列 分 析 技 术 和 基因 识别 方法 的 进步 , 从 DNA 可 以 很 方便 地 推导 出 大 量 的 
蛋白 质 序列 。 这 意味 着 已 知 序 列 的 蛋白 质数 量 和 已 测定 结构 的 蛋白 质数 量 的 差距 将 会 
越 来 越 大 。 因 此 通过 实验 方法 获得 蛋白 质 三 维 结构 越 来 越 无 法 满足 人 们 对 和 蛋白质 结 构 
和 功能 关系 研究 的 要 求 ， 连 切 需 要 一 种 不 依赖 实验 而 又 有 一 定 准确 性 的 获取 和 蛋白质 三 
维 结构 信息 的 手段 ， 蛋 白质 结构 预测 在 后 基因 组 时 代 就 显得 格外 重要 . 

目前 国内 外 关于 蛋白质 结 构 预 测 的 专著 已 有 不 少 ， 但 是 大 都 偏重 于 理论 方面 。 对 
于 从 事 生命 科学 与 生物 技术 研究 的 广大 科研 工作 者 来 说 ， 需 要 的 是 实用 性 强 、 具 有 可 
操作 性 的 技术 类 著作 ， 而 这 方面 的 资料 几乎 是 空白 。 为 了 使 在 生物 医学 领域 的 科技 人 
员 及 研究 生 能 够 循序 渐进 地 掌握 蛋白 质 结构 预测 的 方法 ， 我 们 组 织 了 一 批 在 一 线 从 事 
相关 工作 的 年 轻 博士 出 版 了 这 本 小 册子 。 主 要 向 广大 读者 详细 介绍 蛋白 质 结构 模 建 、 
蛋白 质 的 分 子 对 接 、 蛋 白质 -蛋白 质 相 互 作用 的 模拟 、 蛋 白质 结 构 的 分 子 动力 学 模拟 等 
操作 。 每 一 种 分 析 技 术 都 选择 两 种 软件 ， 一 是 在 业界 声誉 最 好 的 商用 软件 ， 二 是 应 用 
最 普遍 的 免费 软件 。 计 算 分 析 的 对 象 都 是 各 位 编者 个 人 在 实践 工作 中 的 具体 的 分 析 对 
象 。 期 望 通过 阅读 本 手册 ， 可 以 使 从 事 生命 科学 与 生物 技术 研究 的 广大 科研 工作 者 能 
够 掌握 相关 的 技术 要 领 ， 学 会 掌握 这 些 方法 ， 为 他 们 的 科研 工作 服务 。 

本 书 的 第 一 章 由 茵 俊杰 撰写 ， 第 二 章 、 第 四 章 由 岳 俊 杰 、 梁 龙 、 李 北平 撰写 ， 第 
三 章 由 着 俊杰 、 冯 华 、 徐 涛 撰写 ， 第 五 章 由 冯 华 、 刘 明 、 田 然 、 昌 炜 撰写 ， 第 六 章 由 
DE, AA, Ж. BARS., YERE, HR. WH., RHE EE. 


编写 过 程 得 到 了 插 事 医学 科学 院 生 物 工程 研究 所 和 人 刨 腾 科技 有 限 公司 的 大 力 协 
助 ， 在 此 表示 感谢 . 

限于 编者 的 水 平和 精力 ， 再 加 上 时 间 仓 促 ， 书 中 可 能 存在 许多 不 妇 之 处 ， 敬 请 广 
大 读者 批评 和 指正 。 热 情 期 盼 把 您 的 宝贵 意见 函 至 yue junjie@126.com. 


编 者 
2010 年 3 月 
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第 一 节 同 源 模 建 的 基本 原理 及 基础 … 
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一 、 参 考 重 白 搜索 … 
、 确 定 结构 保守 区 … 


、 忧 化 处 理 一 
、 合 理性 检测 … 
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第 三 节 利用 SWISS-MODEL 服务 器 进行 蛋白 质 结 构 同 源 模 建 操作 实例 -PP 


一 、 登 录 服 务 器 ， 输 入 目标 序列 = 
二 、 模 建 结果 与 分 析 … 


第 四 节 和 用 Discovery Stadio й 结构 模拟 系统 进行 同 源 模 建 操作 实例 н 


一 、 识 别 模板 ， 比 对 模板 … 
二 、 将 模板 进行 比 对 … 
三 、 将 目标 序列 与 模板 比 对 … 
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模型 评估 -- 
第 四 章 ”利用 折 释 模式 识别 法 预测 蛋白 质 结构 … 
第 一 节 ” 折 三 模式 识别 法 的 基本 原理 … 
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一 、 程 序 的 安装 … 
二 、Threader 程序 的 运行 … 


第 五 章 ”蛋白 质 分 子 对 接 技术 … 
第 一 节 和 蛋白 质 分 子 对 接 概述 … 
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Вои 执行 分 子 对 接 计 算 … 
二 、 分 析 对 接 结果 … = 
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第 四 节 ”利用 AutoDock платя таннен 及 研究 实例 


一 、AutoDock 23 "~ 

、AutoDock 的 基本 应 用 … 

、 实 例 分 析 … RE 
第 六 章 ”蛋白质 - 重 TERE 

а 蛋白 质 与 蛋白 质 对 接 的 意义 … 
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一 、 设 定 一 qawa sqa iN 
二 、 分 析 ZDOCK 结果 … 


四 、 使 用 RMSD 分 析 结 合 界面 的 氨基 酸 … 
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一 、Hex 的 安装 … 
с? Hex 的 基本 应 用 … 
三 、 对 接 实例 … ve E EE 
第 七 章 t жашна азма 
第 一 节 ”蛋白质 分 子 动力 学 模拟 概述 … us gaa 
ЯС Discovery до F EPA FAINNE 
一 、 淮 备 分 子 动力 学 体系 ， ER 
二 、 分 析 分 子 动力 学 计算 结果 … 
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一 、NAMD 简介 … 


、 构 建 模型 … 

、 分 子 动力 学 模拟 … 

、 可 视 化 与 数据 处 理 … А МИЕ 
第 四 节 利用 GROMACS 进行 分 子 动力 学 模拟 操作 … 


H B H 


жЕ Уг р 


113 
113 
4 

a. 123 


蛋白 质 结 构 


前日 质 是 生 促 活动 的 主要 承担 者 ,一 切 生 命 活动 无 不 与 蛋白 质 密切 相关 。 和 蛋白 质 所 具 
有 的 生物 学 功能 在 很 大 程度 上 取决 于 和 蛋白质 分 子 的 结构 。 蛋 白质 是 由 一 条 或 几 条 多 肽 组 成 
的 大 分 子 ， 每 条 多 肘 链 都 是 一 个 线性 的 氨基 酸 链 。 蛋 白质 是 生物 大 分 子 ， 具有 明显 的 结构 
层次 性 ， 由 低层 到 高 层 可 分 为 一 级 结构 、 二 级 结构 、 三 级 结构 和 四 级 结构 。 一 级 结构 也 称 


一 、 一 级 结构 

捍 日 质 的 一 级 结构 是 指 肽 链 的 氨基 酸 组 成 及 其 排列 顺序 ,包括 二 硫 键 的 连接 关系 。 氨 
基 酸 序列 是 重 白质 分 子 结构 的 基础 ， 它 决定 蛋白 质 的 高 级 结构 。 毛 基 酸 通过 肽 键 连接 在 一 
起 ， 肽 链 一 般 采 取 反 式 构 型 ， 也 就 是 说 火 基 氧 原 子 和 临近 氨基 酸 的 氨基 氧 原 子 彼 此 指向 相 
反 的 方向 。 肽 键 本 身 是 刚性 的 ， 但 是 其 他 键 则 具有 很 大 的 柔性 ， 从 而 使 多 肽 主 链 能 够 在 空 
间 折 登 。 尽 管 反 式 构 型 依然 是 优先 的 ， 但 且 氨 酸 的 残余 基 团结 合 到 多 肽 链 的 主 链 上 ， 因 和 而 
这 样 的 残 基 可 以 形成 顺 式 的 肽 键 ， 使 办 基 氧 原子 和 邻近 氨基 酸 的 氨基 氢 原 子 指 向 同一 个 方 
问 。 这 对 肤 链 主 链 的 折 区 有 很 重要 的 影响 ， pe er nee 
也 会 对 整 人 重大 的 影响 。 正 是 因为 这 氨 酸 通常 在 蛋白 质 结构 中 是 高 度 保 
的 是 的 残 基 ， 因 为 它 具 有 很 小 的 残余 基 团 (只 有 一 个 
ШЕТ) не? 比 其 他 氨基 酸 残 基 具 有 更 大 和 柔性 度 。 半 脱 氨 酸 残 基 也 是 高 度 保 守 的 ， 
因为 它 有 形成 二 硫 键 的 能 力 ， 可 以 将 分 离 的 多 肽 链 连 接 在 一 起 。 


二 、 二 级 结构 

家 日 质 的 二 级 结构 是 由 分 子 内 氧 键 产生 的 有 规则 的 和 重复 的 局 部 构 型 。 二 级 结构 有 时 
候 涉 及 极 性 侧 链 《〈 如 丝氨酸 和 苏 氨 酸 残 基 的 侧 链 )， 但 是 多 肽 主 链 本 身 也 是 极 性 的 ， 因 为 
NH 基 团 可 以 作为 氢 原 子供 体 , C= O 基 团 可 以 作为 氧 原 子 受 体 。 肽 键 贯 穿 多 肽 主 链 的 有 
规则 分 布 有 利于 重复 有 序 的 结构 形成 。a 螺 旋 和 B 折 释 片 是 两 种 最 普通 的 结构 。a 螺 旋 通 党 
是 右手 螺旋 ， 当 两 个 相距 四 个 残 基 的 肽 单元 之 间 形 成 氧 键 时 就 会 出 现 a 螺 旋 。o 螺 旋 使 肽 键 
排 成 了 一 行 。a 螺 旋 的 大 小 变化 是 4 一 40 个 残 基 ， 对 应 于 1 一 11 图 螺旋 。 相 反 ，B 折 又 片 是 
在 多 肽 链 的 键 角 完全 扩展 的 区 域 “这些 区 域 称 为 6 折 秋 股 ) 形成 的 。 几 个 B 折 秋 股 可 以 排列 
成 平行 (parallel)、 反 平行 antiparallel) 或 者 混合 型 的 阵列 ， 相 邻 折 秋 股 之 间 的 肘 单 元 形 
成 了 氧 键 。a 螺 旋 和 B 折 释 片 可 以 通过 一 些 连 接 区 域 结合 在 一 起 ， 这 上 ШКАНЖЕ: 
本 身 的 二 级 结构 ， 这 种 二 级 结构 称 为 回 折 (tum) A. ШЖ Ж ОН НЫШ. X 
翌 的 连接 区 域 成 为 连接 回环 〈loop)。 一 个 蛋白 质 的 内 核 通 常 是 富 含 二 级 结构 的 ， 而 环 区 一 


E 


2 | 蛋白 质 结构 预测 实验 指南 
般 出 现在 表面 。 
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一 个 多 及 的 三 级 结构 ,或 者 折 疮 模式 是 它 的 总 体外 形 ， 反映 了 二 级 结构 和 模 体 堆积 在 
一 起 形成 致密 结 构 域 的 方式 。 一 个 结构 域 可 以 被 看 成 是 一 个 多 肽 链 中 的 一 部 分 ， 这 部 分 可 
以 独立 折 肥 成 一 个 稳定 三 维 结构 。 结 构 域 也 可 以 被 定义 为 功能 的 单元 。 一 个 蛋白 质 可 以 包 
含 一 个 结构 域 ， 也 可 以 包含 几 个 结构 域 。 在 后 面 的 这 一 种 情况 下 ， 不 同 的 结构 域 可 以 按照 
与 蛋白 质 的 整体 生物 学 功能 有 关 的 前 后 联系 来 执行 完全 不 同 的 生物 学 功能 。 


很 多 蛋白 质 只 有 -条 多 肤 链 但 是 其 他 的 很 多 蛋白 质 则 包含 多 条 多 肽 亚 基 。 这 些 亚 基 
的 装配 方式 决定 了 和 蛋 日 质 的 四 级 结构 。 一 个 多 结构 域 蛋白 质 和 具有 几 个 不 同 多 肽 亚 基 的 蛋 
日 质 之 间 没 有 功能 上 的 差别 ， 很 多 蛋白 质 以 这 两 种 形式 存在 。 例 如 ， 大 多 数 转录 因子 都 是 
一 个 具有 DNA 结合 和 转录 激活 结构 域 的 单条 多 肽 , 另外 一 个 则 是 由 不 同 的 亚 基 装配 成 的 。 
实际 上 ， 相 互 作用 的 亚 基 形 成 的 转录 因子 的 装配 正 是 酵母 双 杂 交 系 统 检测 二 元 和 蛋白质 作 用 
ЕЛІ, 也 可 以 通过 多 肽 链 间 二 硫 键 结合 在 一 起 。 


的 基础 。 和 蛋白质 亚 基 可 以 通过 非 共 价 键 相 互 1 
贡 结 构 的 测定 方法 


在 没有 任何 形式 的 结构 数据 来 源 的 情况 下 ， 从 一 个 重 白质 的 序列 开始 ， 从 头 预测 这 个 

和 蛋白质 的 三 级 结构 在 目前 依然 是 不 可 能 的 。 因 而 ， 在 所 有 可 信 程 度 的 情况 下 都 可 以 有 把 握 
地 确定 一 个 在 某 种 程度 上 特征 完全 未 知 的 重 白 质 的 结构 的 唯一 方法 就 是 通过 实验 手段 来 
ЧЕ. е ан райна X баьд Сини) 


两 种 方法 的 一 种 测定 的 ， 余下 的 2% 中 的 绝 大 
多 数 是 基于 义 射 д 晶体 学 结构 和 1 NMR 结构 的 理论 模型 全 部 结构 中 有 不 到 100 个 是 利用 
其 他 方法 ， 如 中 子 衍射 、 电 子 衍 射 和 电子 显微镜 得 到 的 。 
射线 和 NMR 两 种 方法 都 有 非常 苛刻 的 要 求 ， 对 于 每 一 个 蛋白 质 来 说 ， 必 须 
根据 经 验 来 确定 准确 的 实验 条 件 。 久 射线 晶体 学 中 蛋白 质 晶体 的 制备 被 认为 是 一 门 “ 艺术 ” 。 
测定 蛋白 质 结构 的 很 多 尝试 都 是 因为 拿 不 “到 合适 的 晶体 而 失败 。 对 于 NMR 谱 ， 则 是 蛋白 
质 以 溶液 状态 测定 结构 ， 和 蛋白 质 必 须 在 高 浓度 下 是 可 溶 而 且 稳 定 的 ， 而 且 在 这 样 的 条 件 下 
不 能 聚集 或 变性 。 这 两 种 技术 都 需要 对 大 量 的 数据 进行 收集 和 处 理 ， 然 后 是 艰苦 的 模型 装 
配 以 便于 产生 原子 坐标 ， 装 配 的 模型 要 与 实验 得 出 的 结果 相 一致 。 


一 、 瑟 射线 晶体 学 

和 射线 晶体 学 利用 的 是 这 样 一 个 原理 , ври х 射线 经 过 蛋白 质 晶 体 时 , 它 会 以 一 种 可 
预 缸 的 方式 被 散射 或 征 时。X 射线 在 遇 到 电子 时 会 发 生 衍射 ， 因 此 散射 的 特征 依赖 于 出 现 
在 每 个 原子 中 电子 的 数量 和 原子 在 空间 的 排列 。 与 其 他 的 波 一 样 ， 衍 射 的 X 射线 彼此 之 间 
会 发 生 正 疝 的 或 负 向 的 干涉 。 当 蛋白质 分 子 有 规则 地 排列 在 一 个 晶体 中 时 ， 由 不 同 分 子 的 
等 价 原 子 散射 产生 的 在 同一 方向 的 入 射线 会 发 生 相互 作用 , 这 将 在 探测 仪 上 生成 一 个 斑点 
图 案 ， 这 种 斑点 图 案 称 为 反射 。 这 些 衍 射 图 案 可 以 用 于 构建 分 子 的 电子 云 的 三 维 图 像 ， 这 
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种 电子 云 的 三 维 图 像 被 称 为 电子 密度 图 。 重 白质 的 结构 模型 就 是 措 建 在 这 样 的 电子 密度 
图 中 。 

精确 的 结构 测定 需要 一 个 高 度 有 序 的 晶体 ， 这 样 的 晶体 能 够 使 X 射线 产生 强烈 衍射 。 
宣 白质 晶 体 生长 特别 困难 ， 这 是 结构 测定 中 一 个 不 可 忽视 的 瓶颈 。 朴 水 蛋白 质 或 含有 朴 水 
结构 域 的 重 白 质 是 最 难 结晶 的 ， 这 也 就 是 РОВ 数据 库 中 只 有 很 РЛ ЕН ЕНІН 
БІЗ, УНАН ИЖІМЕНЕ ІІ. ОКЕ ЕТЕ RJ KS К Х ЯН 
线 品 体 学 通 量 ， 这 样 就 可 以 在 同一 时 间 党 试 试 验 数 千 个 不 同 的 参数 条 件 ， 比 如 不 同 的 蛋白 
质 浓 度 、 盐 浓度 、 温 度 和 pH 等 ， 以 确定 最 佳 结晶 条 件 。 少 量 的 样品 也 可 以 采用 ， 这 样 可 
以 进行 那些 含量 不 丰富 的 蛋白 质 的 结晶 研究 。 

获得 香 白 质 晶体 之 后 , 式 射 线 晶 体 学 面 对 的 下 一 个 问题 是 从 衍射 图 案 计 算 一 个 电子 密 
意图 。 这 需要 三 方面 的 信息 : 入 射 X 射线 的 波长 、 散 射 的 X 射线 的 振幅 《可 以 通过 反射 
的 强度 测定 出 来 )》 和 衍射 的 相位 。 不 幸 的 是 ， 相 位 不 能 从 反射 的 图 案 中 测定 出 来 ， 这 就 带 
来 了 相位 问题 。 有 时 候 可 以 从 已 经 解析 的 、 存 放 在 和 蛋白 质数 据 库 中 的 相关 结构 中 来 “ 借 ” 
相位 ， 这 种 处 理 手 段 称 为 分 子 置换 法 。 不 过 ， 多 数 时 候 需 要 进行 进一步 的 实验 来 测定 衍射 
相位 。 标 准 的 处 理 过 程 是 制备 包含 重金 属 原 子 的 同形 晶体 ， 也 就 是 在 相同 总 体 结构 的 晶体 
中 结合 上 较 重 的 原子 ， 这 样 可 以 产生 另外 一 种 不 同 的 衍射 图 案 。 包 含 重金 属 原子 的 同形 晶 
体 可 以 通过 在 重金 属 的 盐 溶液 中 浸泡 来 制备 ， 经 过 浸泡 ， 重 金属 原子 能 够 扩散 到 原先 由 溶 
剂 分 子 占据 的 空间 ， 并 与 蛋白 质 分 子 中 某 些 确定 的 位 置 结合 。 重 金属 原子 比 那 些 蛋 白质 分 
子 中 正常 出 现 的 原子 更 强烈 地 使 广 射 线 发 生 衍 射 。 通过 比较 多 种 不 同 的 同型 晶体 产生 的 反 
射 〈 称 为 多 对 同 晶 置换 法 ，multiple isomorphous replacement，MIR )， 就 可 以 确定 这 些 重 原 
子 的 位 置 ， 这 样 就 可 以 推导 出 未 置换 晶体 中 衍射 的 相位 。 每 一 个 反射 的 全 部 描述 即 波长 、 
振幅 、 相 位 ， 它 们 就 是 结构 因子 。 

测定 结构 因子 的 相位 也 可 以 用 异常 散射 法 来 实现 。 当 和 蛋白 质 分 子 中 的 重金 属 原子 在 遇 
到 波长 接近 其 天 然 吸 收 边 限 的 X 射线 照射 时 ， 就 会 导致 рине EONA X 射线 
的 形式 重新 发 射出 其 中 的 部 分 能 量 ， 这 就 是 发 生 了 异常 散射 。 异常 散射 的 幅度 随 着 入 射 X 
射线 的 波长 而 变化 ， 因 此 一 种 含有 重金 属 原子 的 晶体 可 以 被 几 种 不 | 同 波长 的 X 射线 有 照射 ， 
而 产生 几 种 不 同 的 入 射 图 案 ， 从 这 些 入 射 图 案 中 ， 散 射 的 相位 ) 可以 计算 出 来。 这 就 是 单 
HARER FA (single isomorphous replacement with anomalous scattering, SIRAS) 
Hl 长 异常 散射 (multiple wavelength anomalous dispersion, МАР) · “pusa Н, 
改进 的 处 理 手段 可 使 蛋 白质 晶体 无 须 浸 泡 ， 这 种 方法 是 将 蛋白 / 在 细菌 中 表达 时 加 入 一 些 
重金 属 原子 取代 的 氨基 酸 类 似 物 。 

最 后 ， 需 要 在 电子 密度 图 中 搭建 一 个 结构 模型 。 这 需要 一 些 更 有 决定 性 作用 的 信 
明 一 一 氨基 酸 序 列 ， 因 为 通过 XX 射线 照射 不 可 能 明确 地 区 分 出 矶 、 氧 和 和 氮 等 原子 ， 所 以 识 
别 氨基 酸 侧 链 很 困难 ,结果 得 到 的 模型 是 一 套 原子 XYZ 坐标 , 赋予 了 除 毛 以 外 的 所 有 原子 。 
电子 密度 的 数据 越 多 ， 原 子 位 置 的 确定 程度 越 高 ， 模 型 的 分 辨 率 也 越 高 。 虽 然 如 此 ， 仍 然 
可 能 会 有 蛋白 质 分 子 中 某 些 区 域 的 原子 位 置 不 能 精确 测定 。 每 个 原子 都 被 赋予 一 个 所 谓 的 
温度 因子 ， 这 是 确定 性 的 一 个 度量 。 温 度 因 子 越 高 ， 则 确定 性 越 低 。 高 温度 医 
种 情况 ， 一 种 是 无 序 的 一 个 度量 ， 另 外 一 种 是 动力 学 状态 。 
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二 、 核 磁 共 振 

核磁 共振 (nuclear magnetic resonance, NMR) 是 因为 某 些 原 子 核 具 有 位 的 性 质 而 发 
生 的 一 种 现象 。 在 ММЕ 谱 中 ， 这 些 性 质 可 以 用 来 获得 化 学 的 信 А. ЕТА ЧЕ РН 
粒 都 在 绕 着 它们 的 轴 旋 转 ， 并 且 在 很 多 原子 中 ， 这 些 旋转 彼此 平衡 抵消 ， 所 以 原子 核 本 身 
没有 总 旋转 。 在 氨 原 子 〈H) 和 某 些 天 然 存在 的 碘 、 氨 的 同位 素 (PC. UN) 中 ， 这 些 旋 
转 不 能 抵消 ， 这 类 原子 核 会 拥有 一 个 所 谓 的 磁 矩 。 这 样 的 原子 核 可 以 采取 两 种 可 能 的 取 揣 
中 的 一 种 ， БЕ 2. то шы | дыны Аш E mn. P, 


向 则 不 是 。 如 果 这 种 能 1 ка Няня еванын, Ж 
么 这 个 原子 核 就 会 被 请 导 发 生 跃迁 ， 从 低能 量 的 磁 旋 转 状 态 跃 迁 到 不 优先 选择 的 高 能 量 旋 
转 状 态 。 因 为 电磁 辐射 的 频率 与 原子 核 旋转 的 频率 是 一 致 的 ， 所 以 这 种 吸收 称 为 共振 。 当 
原子 核 回 到 它们 的 初始 定向 时 , 这 些 原子 核 会 发 射出 电磁 波 , 这 些 电磁 波 可 以 被 测量 出 来 。 
MT СН) 能 够 给 出 最 强 的 信号 ， 这 一 点 正 是 利用 NMR 谱 进行 蛋白 质 结 构 分 析 的 基础 。 

NMR 谱 可 以 用 于 测定 溶液 中 蛋白 质 的 结构 , 但 需要 蛋白质 是 非常 可 溶 而 且 高 度 稳定 ， 
需要 溶液 浓度 接近 lmmoyL， 并 且 需 要 的 体积 比较 大 〈1~S$mL)。 因 为 所 有 成 键 原 子 附 近 
的 电子 都 会 产生 目 己 的 磁场 ， 所 以 成 键 原 子 附近 的 电子 会 影响 到 每 个 原子 核 的 磁 共 振 频 
率 ， 因 此 NMR 庄 可 以 用 来 测定 结构 。 外 加 的 磁场 的 强度 必须 提高 到 能 够 克服 电子 产生 的 
磁场 的 对 抗 或 屏蔽 ， 扰 动 的 幅度 或 化 学 位 穆 取决 于 每 一 个 原子 核 的 化 学 环境 。 通 过 这 种 方 
法 ， 可 辨别 不 同 的 氧 原子， 如 甲 基 和 芳香 基 团 的 氢 原 子 的 辨别 。 

一 维 核磁 共振 实验 可 以 检测 到 化 学 位 移 以 及 其 他 的 类 似 于 自 旋 - 自 旋 耦 合 〈spin-spin 
oupling) 这 样 的 屏蔽 效应 ， 但 是 在 通常 情况 下 ， 这 些 对 于 描述 像 蛋 白质 这 样 复杂 的 分 子 
是 不 够 的 。 可 以 采用 一 些 由 不 同时 间 间 隔 区 分 的 系列 脉冲 代替 使 用 单个 脉冲 。 这 样 可 以 得 
到 一 个 二 维 的 NMR 谱 ， 这 种 谱 携 带 了 额外 的 峰 ， 这 种 峰 可 以 显示 具有 相互 作用 的 原子 

当 把 相互 作用 的 原子 核对 的 各 种 效应 都 考虑 进去 之 后 ，NMIR 分 析 的 结果 就 是 一 些 距 
离 制 约 的 组 合 ， 通 过 这 些 距 离 约 束 ， 可 以 用 来 推算 某 些 特 定 的 原子 对 之 间 的 距离 (包括 成 
键 的 和 没有 成 键 的 )。 如 果 足 够 的 距离 约束 计算 出 来 ， 那 么 符合 这 些 数据 的 恒 白质 的 结构 
数量 就 会 变 得 非常 有 限 。NMR 分 析 产 生 的 是 10 一 50 个 模型 的 组 合体 ， 而 不 是 一 个 单一 的 
结构 。 高 精度 的 谱 依 赖 于 和 蛋白质 分 子 在 溶剂 中 的 快速 翻转 ， 这 限制 了 可 以 分 析 的 重 
白质 的 大 小 ， 目 前 可 以 分 析 的 蛋白 质 都 少 于 300 个 氨基 酸 残 基 。 如 果 质 子 的 NMR 谱 过 于 
密集 ， 分 析 也 可 以 扩展 到 其 他 的 原子 核 (如 "C 及 “N) 以 产生 名 维和 异 核 的 NMR 谱 , 这 
样 可 以 降低 数据 密度 。 


三 、 结 构 分 析 的 其 他 方法 
除外 射线 晶体 学 和 NMR 外 ， 有 些 其 他 方法 也 可 以 为 解析 的 结构 提供 补充 信息 ， 或 者 
分 析 那 些 在 X 射线 晶体 学 和 谱 两 种 情况 都 不 能 分 析 的 重 白质 结构 。 例 如 ， 贺 二 色谱 
(circular dichroism spectrophotometry，CDS) 就 是 一 个 很 有 用 的 测定 蛋白 质 二 级 结构 的 方 
法 。 圆 二 不 对 称 的 分 子 如 重 白 质 ， ТЕЛЕЕ ЙЕ ЭСТЕН ЖЕНИ 
同 的 吸收 谱 。 圆 二 色 采 用 的 是 波长 160 一 240nm 的 光 ， 这 个 波段 的 光 能 够 分 别 
ЖЕЖ PHAN 白质 产生 明显 不 同和 具有 特征 的 谱 。 圆 二 色谱 不 能 测定 蛋白 质 的 三 
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级 结构 ， 但 是 对 于 结构 生物 学 中 的 和 射线 晶体 学 和 NMR 谱 是 个 有 益 的 补充 。 

“” 鞭 他 的 可 以 用 于 研究 重 白 质 三 级 结构 的 方法 包括 中 子 衍 射 和 电子 衍射 。 中 子 衍 射 比 和 
RATIT KRD) 使 用 的 机 会 少 得 多 ， 这 是 因为 中 子 源 不 能 广泛 地 得 到 ， 而 且 中 子 束 的 流 
量 约 比 X 射线 束 的 流量 低 10 个 数量 级 。 电 子 衍射 用 来 研究 那些 能 够 结晶 形成 或 天 然 装配 
成 二 维 排列 但 不 形成 有 序 的 三 维 晶 体 的 蛋白 质 的 结构 。 电 子 显微镜 的 优势 就 是 可 以 用 分 析 
结晶 排列 的 重 白 质 相 同 的 方式 分 析 那 些 单个 分 子 ， 在 不 用 结晶 的 情况 下 测定 出 大 蛋白 复合 
物 的 结构 。 电 子 显 微 镜 的 分 辩 率 常常 没有 义 射 线 术 射 的 分 辨 率 高 ， 但 是 由 于 不 需要 结 昂 ， 
在 只 有 少量 而 且 不 太 纯 的 样品 的 情况 下 也 可 以 进行 测定 。 


第 三 节 看 白质 结构 预测 的 意义 


尽管 解析 和 蛋白质 结 构 的 技术 已 经 取得 了 非常 重大 的 进展 ， 获 得 了 大 量 的 蛋白 质 结构 ， 
但 解析 重 日 质 结构 依然 是 一 个 劳动 密集 型 和 花费 昂贵 的 过 程 ， 而 且 目 前 各 种 实验 方法 都 存 
在 缺陷 或 限制 。X 射线 单 晶 衍射 最 大 的 缺点 是 要 测定 的 蛋白 质 必须 能 够 形成 晶体 ， 而 许多 
皇 白 质 不 能 结晶 ， 这 就 限制 了 测定 的 范围 。 核 磁 共 振 方 法 虽然 不 需 培 养 蛋白 质 晶体 ， 但 需 
要 筷 日 质 能 够 在 较 高 浓度 下 可 溶 、 稳 定 、 不 聚集 或 变 人 性， 更 重要 的 是 ， 核 磁 共 振 技 术 对 于 
较 大 的 蛋白 质 分 子 的 结构 还 无 能 为 力 。 电 镜 三 维 重 构 需要 培养 二 维 晶 体 ， 而 且 目 前 测定 的 
结构 的 分 辨 率 还 不 够 高 ， 还 没有 成 为 测定 蛋白 质 结构 的 常规 方法 。 

生日 质 空 间 绪 构 的 删 定 速度 还 远 远 赶不上 蛋白质 序列 增长 的 速度 , 并 且 随 着 基因 组 测 
序 的 进行 , 二 者 差距 有 越 来 越 大 的 趋势 , 截止 2009 年 10 Б, 已 知 序列 的 蛋白 质 已 超过 100 
万 ， 而 已 知 结构 的 蛋 日 质 仅 有 6 万 多 。 因 此 和 蛋白 质 结构 预测 成 了 目前 了 解 蛋白 质 结构 信息 
的 一 个 非常 有 效 的 实际 手段 。 随 着 基因 组 和 和 蛋白 质 组 计划 的 研究 进展 ， 大 量 的 具有 特殊 功 
的 蛋白 质 将 被 发 现 ， 对 蛋白 质 空间 结构 预测 的 要 求 也 越 来 越 迫 切 。 

除了 获得 蛋白 质 结构 信息 之 外 ， 和 蛋白 质 结构 预测 还 有 重大 的 理论 意义 。 生 命 遗 传 信息 
存储 传递 及 表达 的 认识 是 20 世纪 生物 学 所 取得 的 最 重要 的 突破 ， 其 中 的 关键 问题 是 由 3 
个 相连 的 核 苷 酸 顺 序 决定 和 蛋白质 分 子 肢 链 中 的 1 个 氨基 酸 ， 即 “三 联 遗 传 密码 ”(“ 第 一 
遗传 密码 ”) 的 破译 。 和 蛋白 质 必 须 有 特定 的 三 维 空间 结构 ， 才 能 表现 其 特定 的 生物 学 功能 。 
20 世纪 60 年 代 Anfinsen 就 提出 恒 白质 分 子 的 一 级 序列 决定 其 空间 结构 的 论断 ， 这 一 论断 
得 到 多 次 实验 证 实 并 被 人 们 广泛 接收 ， 大 量 实验 充分 说 明和 蛋白 质 的 氨基 酸 顺 序 与 其 空间 结 
构 之 间 存 在 着 确定 的 关系 。 国 际 上 将 蛋白 质 的 氨基 酸 序列 与 其 空间 结构 的 对 应 关系 称 之 为 
“第 二 遗传 密码 ”。 但 是 直到 现在 ,“ 第 二 遗传 密码 ”依然 没有 得 到 破译 ， 这 个 问题 是 蛋白 
质 研究 最 后 几 个 尚未 揭示 的 奥秘 之 一 。 和 蛋白 质 结构 预测 实际 上 是 去 从 理论 上 最 直接 地 解决 
和 蛋白质 的 折 肥 问题 ， 即 破译 “第 二 遗传 密码 ”。 

近年 来 随 厦 结构 生物 学 的 发 展 ,解析 的 蛋白 质 结构 越 来 越 多 ,这 就 为 研究 和 总 结 蛋 白 
质 结构 的 规律 打下 了 很 好 的 基础 ， 也 为 蛋白 质 的 结构 预测 提供 了 参考 。 另 外 计算 机 科学 与 
技术 的 快速 进步 也 大 大 地 促进 了 和 蛋白 质 结构 预测 的 发 展 。 蛋 白质 结构 预测 问题 虽然 还 没有 
最 终 解决 ， 但 是 已 经 取得 了 一 些 令 人 欣喜 的 成 就 。 目 前 ， 和 蛋白 质 空间 结构 预测 的 方法 有 3 
Ж, ШАНШАР. ЕЕЕ ӨН. 

1， 从 头 预测 法 

ЖАҚТАЙ! Cab initio prediction) 也 称 为 理论 计算 预测 ， 是 指 从 和 蛋白 质 的 一 级 结构 出 发 ， 
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根据 物理 化 学 、 量 子 化 学 、 量 子 物理 的 基本 原理 ， 利 用 各 种 理论 方法 计算 出 重 白 质 肽 链 所 
有 可 能 的 构象 的 能 量 ， 然 后 从 中 找到 能 量 最 低 的 构象 ， 就 是 蛋白 质 的 天 然 构 象 。 这 种 方法 
不 需要 已 知 结构 信息 ， 能 够 产生 全 新 结构 。 但 是 由 于 计算 的 难度 ， 这 种 方法 只 能 用 于 计算 
很 小 的 分 子 或 蛋白 质 分 子 的 局 部 结构 ， 目 前 还 不 能 作为 一 种 常用 的 预测 蛋白 质 结构 的 方 
法 。 现 在 从 头 预测 主要 用 作 其 他 预测 方法 的 补充 或 作为 一 种 优化 结构 的 手段 。 

2. 比较 建 模 法 

比较 建 模 法 (comparative modeling) 也 称 为 同 源 建 模 法 (homology modeling)， 是 基 
于 知识 的 蛋白 质 结构 预测 方法 。 根 据 对 PDB 中 的 蛋白 质 进行 结构 比较 的 定量 研究 得 知 ， 
任何 一 对 蛋白质， 只 要 它们 序列 的 长 度 达到 一 定 程 度 ， 序 列 相似 性 超过 30% ， 则 可 以 保 
证 它们 具有 相似 的 三 维 结构 。 因 此 ， 对 于 一 个 未 知 结构 的 蛋白 质 ， 如 果 找 到 一 个 已 知 结构 
的 同 源 重 白质 ， 就 可 以 该 蛋白 质 的 结构 为 模板 ， 为 未 知 结构 的 重 日 质 建 并 结构 模 型 。 同 沁 
模 建 通常 包括 下 列 主要 步 又， 模板 搜寻 、 序 列 比 对 、 结 构 保 守 区 寻找 、 目 标 模 型 措 建 、 结 
构 优 化 和 评估 等 。 在 目前 的 三 种 预测 蛋白质 结 构 的 方法 中 ， 比 较 建 模 法 是 最 简单 、 最 为 成 
熟 的 。 很 多 实验 室 都 可 以 开展 同 源 模 建 预 测 恒 白质 结构 的 工作 。 

3. HARINA 

HARRE (fold recognition) 也 称 为 反问 折 笃 法 (inverse fold method), threading 等 。 
该 方法 基于 这 样 一 个 事实 ， 即 很 多 序列 没有 相关 性 的 蛋白 质 具有 相似 的 折 符 模式。 因此 可 
以 基于 序列 结构 比 对 (sequence structure alignment) 的 预测 方法 ， 通 过 目标 蛋白 质 的 氨基 
目标 序列 的 折 和 又 模式 。 折 炙 识 别 法 可 以 弥补 同 源 模 建 方 法 只 能 依赖 序列 相似 性 寻找 模板 的 
不 足 ， 是 目前 三 种 预测 蛋白 质 结构 的 方法 中 发 展 最 快 也 是 最 有 前 途 的 方法 。 


重 日 质 的 二 级 结构 是 指 多 肤 链 中 党 一 个 方向 排列 成 具有 周期 性 结构 的 构象 , 它 是 蛋白 
质 多 肽 主 链 中 有 规则 的 重复 构象 。 和 蛋白 质 二 级 结构 是 蛋白 质 分 子 中 重要 的 组 成 “部 件 风 
是 研究 重 白 质 氨基 酸 序 列 和 三 级 结构 之 间 的 桥梁 。 和 蛋白 质 二 级 结构 的 预测 对 于 和 蛋白质 三 维 
结构 的 预测 具有 十 分 重要 的 意义 。 | 

二 级 结构 预测 也 常 称 为 三 态 预测 , 因为 序列 中 的 每 一 个 氨基 酸 残 基 都 可 以 归结 为 螺旋 
(helix, H), УК НТ (extended B-strand, Е) 或 卷曲 〈coil，C) 三 种 状态 。 早 在 20 
世纪 60 年 代 中 后 期 ， 科 学 家 们 就 开始 了 重 白 质 二 级 结构 预测 方面 的 研究 ， 到 目前 已 发 展 
了 几 十 种 预测 方法 。 这 些 方法 大 臻 上 可 分 为 三 大 类 ;第 一 类 是 统计 学 方法 ， 第 二 类 是 基于 

体 化 学 原则 的 物理 化 学 方法 ， 第 三 类 是 神经 网 络 和 人 工 智 能 方法 。 
asman 法 是 统计 NT Chou-Fasman 对 已 知 结构 的 蛋白 质 进 行 了 

统计 处 理 ， 计算 出 20 种 氨基 酸 出 现在 а 螺旋 折合 和 卷曲 三 种 构象 中 的 分 布 情况 ， 然后 
得 到 每 一 种 毛 基 酸 在 这 些 二 级 结构 构象 中 的 构象 参数 。Chou-Fasman 法 中 的 构象 参数 主要 
A: 氨基 酸 残 基 形 成 a 螺旋 的 倾向 性 因子 Pu; 氨基酸 残 基 形 成 折 登 股 的 倾向 性 因子 PB; 
氨基 酸 残 基 形 成 卷曲 结构 的 倾向 性 因子 Pt。 氨基 酸 的 构象 参数 值 反映 了 和 氨基酸 出 现 某 种 二 
级 结构 中 可 能 性 的 大 小 。 根 据 统 计 的 规律 ，Chou-Fasman 提出 了 一 些 二 级 结构 成 核 、 延 伸 
和 终止 的 规则 ， 根 据 这 些 规 则 可 以 预测 已 知 序 列 的 和 多肽 链 的 二 级 结构 。 

利用 物理 化 学 方法 预测 蛋白 质 二 级 结构 最 著名 的 是 Lim 方法 ,该 方法 在 预测 蛋白 质 二 
级 结构 时 考虑 了 重 白 质 折 香 构 和 象 的 立体 化 学 特征 和 物理 化 学 性 质 ， 比 如 残 基 侧 链 基 团 的 体 
积 大 小 、 凌 / 朴 水 性 质 和 所 带电 荷 等 因素 ， 另 外 这 一 方法 还 充分 考虑 了 邻近 氨基 酸 残 基 之 间 
的 相互 作用 情况 。 此 外 ， 根 据 已 经 测定 的 蛋白 质 结构 情况 ， 该 方法 还 总 结 了 形成 a 螺旋 或 
B 折 难 构 象 的 结构 模式 和 立体 化 学 特征 。 比 如 ， 可 以 看 到 a 螺旋 结构 中 经 常 是 一 个 侧面 对 
看 六 水 表面 ， 男 一 侧 对 看 玖 水 核心 。Lim 等 人 对 a Е ВЗА Т 20 ЖЖ Ж 
布 模式 。 根 据 序 列 中 有 规律 的 杀 / 朴 水 性 残 基 的 分 布 ， 可 以 对 蛋白 质 的 二 级 结构 进行 预测 。 
在 有 些 情况 下 该 方法 的 预测 准确 率 相当 高 (尤其 是 对 较 小 的 蛋白 )。 

神经 网 络 和 人 工 智 能 方法 是 新 兴 的 预测 蛋白 质 二 级 结构 的 方法 , 自前 二 级 结构 预测 应 
用 最 广 的 神经 网 络 算法 是 BP 网 络 (back-propagation network)， 即 反馈 式 神经 网 络 算法 。 
它 通 常 是 由 三 层 相同 的 神经 元 构成 的 屋 状 网 络 ， 使 用 反馈 式 学 习 规 则 ， 底 层 为 输入 层 ， 中 
间 为 隐 含 层 ， 顶 层 是 输出 层 ， 信 和 号 在 相 邻 各 层 间 逐 层 传递 ， 不 相 邻 的 各 层 间 无 联系 ， 在 学 
习 过 程 中 根据 输入 的 一 级 结构 和 二 级 结构 的 关系 的 信 轧 不 断 调整 各 单元 之 间 的 权重 ， 最 经 
目标 是 找到 一 种 好 的 输入 与 输出 的 映像 ， 并 对 未 知 二 级 结构 的 蛋白 进行 预测 。 这 些 方法 与 
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传统 的 方法 相 比 最 大 的 特点 是 预测 二 级 结构 时 不 仅仅 是 基于 单 序列 和 单个 氨基 酸 ， 而 是 利 
用 了 多 序列 。 通 过 从 多 重 序列 的 比 对 中 学 习 规 则 ， 利 用 神经 网 络 的 方法 进行 序列 的 预测 。 
这 类 算法 发 展 较 快 ， 已 经 有 很 多 成 功 的 应 用 。 


第 二 节 ”看 白质 二 级 结构 预测 实例 


PSIPRED 方法 是 由 英国 David T. Jones 实验 室 开发 的 基于 神经 网 络 算法 的 蛋白 质 二 级 
结构 预测 软件 ， 在 预测 过 程 中 利用 了 多 重 序列 比 对 并 且 结 合 了 从 数据 库 中 提取 的 结构 和 进 
化 信息 。 它 先 使 用 PSI-BLAST 在 数据 库 中 搜索 序列 的 相似 蛋白 ， 构 建 多 序列 比 对 ， 然 后 
在 此 计算 结果 基础 上 进行 结构 预测 。PSIPRED 用 两 个 前 向 神经 网 络 对 来 自 PSI-BLAST 的 
特征 图 进行 分 析 。 序 列 可 以 通过 互联 网 用 简单 的 单字 母 格 式 或 是 FASTA ҚА, 
PSIPRED 的 预测 结果 通过 电子 邮件 以 文本 文件 形式 发 送 回 来 。 另外 ,在 电子 邮件 中 会 给 出 
一 个 网 址 ， 到 那里 可 以 看 到 被 预测 和 蛋白质 的 图 像 表示 ， 可 视 化 是 用 JAVA 应 用 程序 
PSIPREDview 实现 的 。PSIPRED 的 平均 预测 准确 率 为 78%， 在 多 次 二 级 结构 预测 评估 中 
取得 领先 ， 被 认为 是 一 种 较为 准确 的 蛋白 质 二 级 结构 预测 方法 。 本 节 以 山门 螺杆 菌 脂 重 白 
lpp20 为 例 ， 利 用 PSIPRED 程序 预测 了 其 二 级 结构 。 

第 1 步 ， 启 动 网 络 服务 器 ， 登 录 页 面 http://bioinf4.cs.ucl.ac.uk:3000/psipred， 就 会 看 到 
如 图 2-1 页 面 。 
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McGufta LJ, Bryson K, Jones OT. (2000) Тһе PAIPRED protein structure prediction server  Ehoimfommnalics. 16 404-405. 


图 2-1 PSIPRED 条 白质 二 级 结构 在 线 预测 窗口 


第 二 章 ”蛋白 质 二 级 结构 预测 | 9 


第 2 步 ， 在 页 面 中 填 入 1рр20 和 蛋白 的 序列 、 自 己 的 电子 信箱 ， 并 点 击 Predict 命令 ， 即 
可 完成 预测 任务 的 输送 ， 程 序 会 自己 进行 计算 。 

第 3 步 ， 几 分 钟 后 ， 在 目 己 的 信箱 中 会 收 到 预测 结果 的 链接 。 自 己 的 预测 页 面 也 会 切 
换 到 预测 结果 。 

1рр20 和 绰 白 的 二 级 结构 预测 结果 如 图 2-2 所 示 。 结 果 中 不 仅 包 括 预测 的 各 个 残 基 所 处 
的 构象 ， 而 且 还 给 出 了 预测 的 可 信 度 评估 。 


Солі: T E A n 
FT 一 一 
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E = helix Conf: J-a g Е = cönfidənce of prediction 
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[~ ep = strand Pred: predicted secondary structure 


— 2 Coil АА: target saquenca 


2-2 PSIPRED 的 蛋白 质 二 级 结构 预测 结果 


司 一 个 家 族 的 蛋白 质 成 员 往往 具有 类 似 的 结构 和 功能 ， 如 丝氨酸 和 蛋白酶 家 族 、 血 红 蛋 
日 家 族 等 。 通 过 对 已 经 测定 的 和 蛋白质 的 空间 结构 进行 对 比 ， 人 们 发 现 ， 蛋 白质 的 三 级 结构 
比 一 级 结构 更 保守 ， 同 源 蛋 白质 之 间 具 有 相似 的 空间 结构 ， 同 源 蛋 白质 之 间 具 有 保守 的 结 
构 内 核 ， 差 异 仅 存在 分 子 表面 的 回 折 区 。 一 般 情况 下 ， 如 果 两 个 蛋白 质 的 序列 同 源 性 不 低 
于 50%, 那么 这 两 个 蛋白 中 90% 的 Cs 原子 均 方 根 偏差 不 会 超过 3 А4; ШАБ 
ВЛАЖНА ТАНИТ C“ 原子 之 间距 离 的 均 方 根 偏差 (RMS) 为 衡量 标准 ， 其 RMS 不 会 
大 于 1A。 而 同 源 性 低 于 50% 的 蛋白 质 分 子 之 间 的 许多 结构 参数 如 Cs ATH RMS, RE 
的 溶液 可 及 性 、 侧 链 构象 等 的 保守 性 都 会 减弱 ， 但 是 依然 具有 较 强 的 相似 性 。 甚 至 对 于 两 
个 序列 相似 性 为 20% 左 右 的 远亲 和 蛋白， 在 某 些 情 况 下 ， 其 等 价 的 主 链 原子 之 间 的 RMS 有 
时 候 仍 然 可 以 在 1.8 一 3.0A， 相 同 折 和 登 方式 的 区 域 有 时 候 会 超过 整个 蛋白 分 子 的 一 半 以 上 。 

通常 情况 下 , 可 以 将 序列 相似 性 超过 30% 的 蛋白 质 分 子 归属 为 一 个 家 族 , 同一 个 蛋白 
质 家 族 的 成 员 由 同一 个 “祖先 ”进化 而 来 ， 它 们 之 间 具 有 保守 的 三 维 结构 。 当 一 个 蛋白 质 
家 族 中 的 某 一 个 成 员 测 定 了 三 维 结构 之 后 ， 就 可 以 用 这 个 结构 作为 模板 ， 来 预测 该 家 族 的 
Кл aaa a тыа 
нна и РИУ Hi 


ü 


ое пон а. aenea роот 
序列 联 配 达 到 最 佳 ， 这 些 干预 就 成 为 模 建 成 功 必 要 的 补充 。 
如 果 一 个 待 预测 的 序列 可 以 拿 到 几 个 模板 结构 , 通常 比较 合适 的 做 法 是 先 将 这 些 模板 
结构 县 合 ， 然 后 利用 模板 中 原子 的 平均 位 置 进行 模 建 。 通 常情 况 下 ， 模 建 时 使 用 多 个 模板 
结构 会 比 只 用 一 个 模板 结构 的 效果 要 好 ， 结 构 保 守 区 的 结构 也 比 非 保守 区 域 更 可 靠 。 
1969 年 Browne 及 其 同事 首先 以 鸡蛋 清 溶菌 酶 的 结构 为 基础 , 手工 模 建 了 a- 驰 白 蛋 白 
的 空间 结构 ， 并 获得 了 成 功 ， 从 此 开创 了 利用 向 源 模 建 技术 预测 蛋白 质 空间 结构 的 先河 。 
1981 年 ，Greer 等 人 建立 了 利用 多 个 同 源 蛋 白质 进行 结构 预测 的 方法 ， 并 将 该 方法 用 于 模 
建 哺乳 动物 丝氨酸 蛋白 酶 的 结构 。 


ФІА-10 "m. 
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同 源 模 建 是 蛋白 质 三 维 结构 预测 的 主要 手段 , 也 是 目前 为 止 盘 白 质 结构 预测 中 最 为 成 
功 、 准 确 度 最 高 的 方法 ， 但 同 源 模 建 有 一 个 前 提 条 件 ， 即 要 模 建 的 目标 蛋白 必须 有 一 个 或 
多 个 已 知 结构 的 与 之 序列 高 度 相 似 的 同 源 蛋 白 。 通 常情 况 下 ， 目 标 蛋 白 与 模板 蛋白 的 序列 
一 致 性 不 低 于 30%， 如 果 二 者 能 够 进行 联 配 的 区 域 长 度 超 过 100 个 氨基 酸 残 基 ， 序 列 一 致 
性 在 25% 以 上 也 可 以 进行 同 源 模 建 。 如 果 模 板 和 蛋白 与 目标 序列 的 序列 一 致 性 在 15%—25%, 
即 所 谓 的 “交界 区 域 ”(twilight zone) 则 不 能 利用 简单 的 同 源 模 建 来 预测 结构 。 研 究 表明 ， 
序列 一 致 性 在 交界 区 域 的 蛋白 质 之 间 是 否 有 同 源 关 系 无 法 根据 序列 来 确定 。 对 于 同 源 性 在 
这 个 区 域 的 蛋白 质 进行 比较 后 发 现 ， 分 子 中 等 价 的 二 级 结构 单元 之 间 的 相对 位 置 偏差 可 达 
7A， 方 向 偏差 可 达 30?。 因 此 在 同 源 模 建 中 如 果 参 考 蛋 白 和 目标 蛋白 之 间 的 序列 进化 关系 
较 远 ， 那 么 就 会 出 现 很 多 严重 问题 。 尽 管 粗 略 的 整体 蛋白 结构 特征 可 以 很 好 地 模 建 出 来 ， 
但 某 些 具体 的 区 域 可 能 由 于 几 个 残 基 的 联 配 错误 而 导致 模 建 错误 。 模 建 出 来 的 结构 很 可 能 


集 。 在 接 下 去 的 分 子 力学 或 分 子 动力 学 优化 中 ， 这 些 错误 不 但 不 会 被 清除 掉 反 而 会 引入 新 
的 结构 扭曲 。 这 是 因为 基于 错误 的 初始 结构 的 能 量 优化 会 导致 以 若干 氧 键 断裂 为 代价 的 整 
个 二 级 结构 的 重新 定位 。 只 有 进化 上 紧密 关联 的 和 蛋白质 分 子 之 间 的 C 原子 КМ5 才 会 小 于 
2A， 所 以 用 于 同 源 模 建 模板 的 参考 蛋白 与 目标 蛋白 之 间 的 序列 同 源 性 最 低 限 度 不 能 小 于 
25%， 否 则 模 建 的 结构 其 可 靠 性 就 大 打折 扣 。 当 然 如 果 有 其 他 生物 学 证 据 证 实 两 个 序列 相 


似 性 低 的 蛋白 之 间 在 进化 上 具有 明显 的 亲缘 关系 ， 由 同 源 性 较 低 的 重 白 结 构 模 建 目标 蛋白 
有 时 也 可 能 会 获得 比较 好 的 结果 。 通 常 的 情况 下， 如果 利用 序列 相似 性 搜索 无 法 寻找 到 同 
源 性 高 于 25% 的 模板 蛋白 ， 则 需要 利用 折 赤 模 式 识 别 的 方法 来 寻找 参考 蛋白 。 


BP ” 同 源 模 建 预测 蛋白 质 结 术 


司 源 模 建 过 程 主要 可 分 以 下 几 个 阶段 。 


根据 目标 蛋白 的 一 级 序列 搜索 参考 蛋白 是 同 源 模 建 的 第 一 步 , 搜索 策略 的 掌握 直接 关 
系 到 以 后 模 建 的 成 功 与 否 。 搜 索 的 范围 为 蛋白 质 结构 库 (РОВ). 


二 、 人 确定 结构 保守 区 

如 果 目 标 重 白 有 两 个 以 上 已 知 结构 的 参考 蛋 日 , 可 通过 这 些 参考 蛋白 之 间 的 结构 登 合 
来 确定 结构 保守 区 《SCRs)， 这 是 比较 理想 的 情况 。 如 果 参 考 和 蛋白 中 只 有 一 个 有 空间 结构 ， 
那么 结构 保守 区 的 确定 就 必须 通过 多 重 序列 对 比 的 方法 来 实现 。 


三 、 蛋 白 主 链 的 模 建 

结构 保守 区 的 主 链 坐标 可 以 直接 由 参考 蛋白 拷贝 下 来 ， 主 链 的 模 建 关键 在 于 环 区 .。 一 
般 环 区 的 模 建 有 两 个 途径 。 一 种 途径 是 片段 搜索 ， 根 据 待 模 建 环 区 的 端点 距离 及 环 区 两 端 
结构 保守 区 的 主 链 构象 在 已 知 的 片段 库 里 搜索 出 若干 (一 般 是 10 个 ) 最 符合 条 件 的 片段 
供 参 考 。 男 一 种 环 区 模 建 的 途径 是 自动 生成 法 。 自 动 生 成 法 不 需要 任何 模板 片段 ， 它 利用 
随机 搜索 的 方法 确定 环 区 构象 。 这 种 方法 适合 很 小 环 区 的 模 建 ， 对 于 稍微 大 一 些 的 环 区 耗 
时 太 长 而 且 随机 搜索 的 构象 空间 也 不 一 定 完 全 ， 因 而 结果 不 一 定好 。 
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四 、 侧 链 安装 

统计 研究 表明 ， 和 蛋白 质 分 子 中 残 基 的 侧 链 取 向 不 是 杂乱 无 章 的 ， 事实 上 一 个 氨基 酸 残 
基 有 的 侧 链 构象 可 以 归结 为 几 种 分 立 的 最 可 几 构 象 ， 这 些 分 立 的 构象 形成 一 个 转子 文库 。 侧 
链 搜 索 的 任务 就 是 在 转子 文库 中 挑选 出 最 佳 的 侧 链 构象 组 合 。 

五 、 优 化 处 理 

捍 日 质 分 子 的 主 、 侧 链 都 确定 后 只 能 说 得 到 了 一 个 初步 结构 ， 需 要 进一步 优化 使 之 更 
加 合理 。 优 化 的 手段 主要 是 分 子 力学 和 分 子 动力 学 。 


六、 合理 性 检测 

模 建 的 结构 合理 与 否 可 以 通过 多 种 不 同 的 方式 来 检验 ， 最 常用 的 是 Profiles-3D 检测 。 
Profiles-3D 可 以 检测 出 模 建 的 蛋白 中 哪些 残 基 的 构象 不 合理 ， 不 合理 程度 多 大 ， 这 样 研究 
者 可 以 依 此 对 不 合理 的 部 分 再 优化 或 改变 策略 重新 横 建 。 


第 三 节 ”利用 SWISS-MODEL 服务 器 进行 
蛋白 质 结 构 同 源 模 建 操作 实例 


和 捍 白 质 同 源 模 建 技术 逐渐 成 为 一 个 较为 常规 的 分 析 方法 ， 目 前 互联 网 上 提供 了 很 多 
利用 同 源 模 建 技术 预测 的 蛋白 质 结构 的 服务 器 ， 比 如 SDSC1 (San Diego), 3D-JIGSAW 
(London). FAMS (Tokyo) 和 SWISS-MODEL (Geneva)。 其 中 Guex 等 人 发 展 的 SWISS- 
MODEL 是 使 用 最 广泛 的 网 络 模 建 服务 器 ，SWISS-MODEL 是 一 个 自动 化 的 、 对 学 术 团 体 
免费 的 蛋白 质 结构 模拟 环境 ， 任 何人 都 可 以 登录 网 站 进行 蛋白 质 结构 的 同 源 模 建 。 本 节 以 
鼠 尿 酸 氧 化 酶 的 结构 模 建 为 例 说 明 如 何 利用 SWISS-MODEL 服务 器 来 进行 蛋白 质 的 三 维 
结构 异 建 。 


一 、 登 录 服 务 器 ， 输 入 目标 序列 
可 以 通过 http://swissmodel.expasy.org 访问 SWISS-MODEL 服务 器 的 web 界面 ， 如 
3-1. 
ЕР 
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图 3-1 SWISS-MODEL 服务 器 初始 页 面 
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ASRA (Automated Mode): 用 于 建 模 的 氨基 酸 序列 或 是 Swiss-Prot/TrEMBL 编目 
号 (accession) 可 以 直接 通过 web 界面 提交 。 用 户 可 以 选择 指定 模板 结构 ， 模 板 可 以 来 自 
由 PDB 数据 库 抽 取得 到 的 内 建 模板 库 ， 也 可 以 上 传 PDB 格式 的 坐标 文件 。 

联 配 模式 〈Alignment Mode): 这 个 模式 需要 多 序列 联 配 的 结果 ， 联 配 的 序列 中 需要 
包括 目标 序列 和 模板 . 用 户 需要 指明 联 配 文件 中 哪 一 条 序列 是 目标 序列 , 哪 一 条 作为 模板 。 
服务 器 会 基于 比 对 结果 建 模 。 

MRA (Project Mode): 这 种 模式 允许 用 户 提交 经 过 手工 优化 的 请 求 给 服务 器 。 
DeepView 被 用 来 建立 一 个 项 目 文件 ， 它 包含 了 模板 结构 ， 以 及 目标 序列 与 模板 的 联 配 结 
果 。 这 个 结果 也 要 上 传 到 服务 器 。 这 种 方式 提供 对 建 模 过 程 中 细节 的 控制 ， 例 如 选择 不 同 
的 模板 ， 手 工 编辑 目标 序列 和 模板 的 联 配 结果 ， 以 便 正确 地 定 下 插入 和 删除 的 位 置 。 项 目 
模式 还 能 够 用 于 重复 改进 First Approach mode 的 结果 。 

选择 自动 模式 。 在 本 实例 中 , 选择 Automated Mode ( 自动 模式 ), 点 击 Automated Mode 
键 之 后 , 就 会 进入 自动 模 建 模式 页 面 (图 3-2), 需 要 在 Provide a protein sequence or a UniProt 
AC Code 对 话 框 填 入 需要 预测 结构 的 蛋白 质 序 列 ， 序 列 可 以 填 入 FASTA 格式 或 填 入 序列 
在 UnitProt 数据 库 中 的 登录 号 也 可 以 。 

(@ SWISS-MODEL Workspace 


Rieposiorny  Documenistion 


| ип | 


[anms eam 00 
еше oase у 000 


Email 
Project Title в пәкізде 


СЕУЕОННБӘРРУ1НЗБІ ҚЫНУЫНГТОЗӘГРІЛТЕКІМІІТІРҒУКПЕСТАТПУҮГКИЕҮСБЕПЕПҒЕЛІН 
БАУЫЛІУІЛИЖҒАБРҮЖПЕҮЗРЗУДЕГІ ОТОЧ ЗІЗОІ.РЕТЕІМЕТБІРМІНҰҒЫ ЫЧИМОТІНЕРЕТ 
ТІРІПМЕҮСЕТІСІТЕРЕІРІНІ. 


Options: @ 
Ше а вресіс tempias: | ә 


БРРРЕКРК а a 


图 3-2 SWISS-MODEL 服务 器 命令 界面 


在 本 实例 中 ， 直 接 把 鼠 尿 酸 氧 化 酶 的 氨基 酸 序列 粘贴 在 序列 提交 对 话 框 ， 使 用 者 的 
电子 信箱 可 以 填写 也 可 以 不 填写 ， 如 果 填 写 使 用 者 的 电子 信箱 ， 提 交 任 务 后 ， 使 用 者 会 收 
到 邮件 提示 。 填 写 完 模 建 信息 之 后 ， 点 击 Submit Modelling Request 键 ， 即 可 向 模 建 服务 器 
提 丰 模 建 任务 。 提 交 任 务 后 ， 模 建 页 面 会 显示 任务 提交 成 功 。 间 时 ， 因 为 填写 了 email 地 
址 ， 因 此 在 填 入 的 在 信箱 中 收 到 了 提交 任务 成 功 的 邮件 。 


二 、 模 建 结 果 与 分 析 

提交 任务 大 约 几 分 钟 之 后 ， 邮 箱 会 收 到 模 建 任务 已 经 完成 的 邮件 。 同 时 ，SWISS- 
MODEL 服务 器 页 面 也 会 日 动 更 新 ， 显 示 模 建 结果 (图 3-3)。 在 本 实例 中 ， 模 建 的 是 女 尿 
酸 氧化 酶 的 结构 ， 模 建 结 果 中 模 建 的 范围 是 18 一 297， 模 建 采 用 的 模板 其 分 辩 率 是 2.8A， 
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目标 序列 与 模板 序列 的 相似 性 是 34.576%。 模 建 获得 的 结构 模型 可 以 通过 点 击 DeepView 
坦 看， 另外 也 可 以 点 击 download 键 下 载 为 pdb 格式 的 文件 。 可 以 通过 模 建 结 果 网 页 中 的 
Print/Save this page as 将 结果 文件 保存 在 一 个 PDF 文件 中 。 

Ж === 


| туда Карасе | 


| SWISS-MODEL Workspace 
Мала 


Төбе БНәроөйыу) -~ Docurnoptation 
| legn | 
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Model Details: @ Segment 1 


2 Model info: 

| modeled residue range 18 to 297 

| based оп tempale 1хх]Н (2 В0 А 
| Sequence ldentity [X] 34 57 
| Еліне 0 00-1 


display model: вз pdb- ас Сеере proect 
download model: as pdb - as Сеере; pojai - as text 


3-3 SWISS-MODEL 服务 器 的 模 建 结 果 信 息 


在 弹出 的 模 建 结果 网 页 中 ， 还 有 目标 重 日 序列 与 模板 结构 的 序列 联 配 信息 (图 3-4), 
对 模 建 结构 的 合理 性 评估 信息 “图 3-5). 


Alignment 
TARGET 18 RIGYG КОМТЕУІНІО БІУ:--КҮНЕІ KEVATSVOLT ІЬІРЕККГУУИНО 
1ххјВ 2 avk--aaryq kdnvrvykvh kdektgvgtv yemntvevlle цеіевлуеКа 
TARGET as пазпсалапа ва паов ппййзлйтазв hhhh 
їхк]В йй байагы: G паво врпалзввыиян ва hhhh 
TARGET 6 1 ПИНБІМІРТІТ IENTVHVLAK LREGIRHIETF AMNMNICEHFLS БЕМНУТНАНУ 
1хх1В Бі dnovivatds ikntiyitak дпрутрре1Ғ gsilgthfie kynhihaahv 
TARGET hhh hhhhhhhhhh h hhhh hFhhhhhhhhh h аагип 
1ххјВ hhh hhħhhhhhhhhh h hhhh hhhhhhhhhh h sosooas 
TARGET 111 ҰХУБЕУРМЕРР ЕКМОСІКНУНА ҒБІНТРТОТНР СЕУЕОМЕНОР РМУІҢЗСІКІЛ, 
1хх1В 100 nivchrwtrm Qidgkphpha firdseekrn vavdvegkg idikeslegl 
TARGET manan да gg H0S п бп авв япвявптп пвлалпана 
іхујВ аспап сап ов лаз п ап EDG явянялав A олапоотаовв 
TARGET 161 КҮ,ЕТТОБОҒ EGFPLEDOFTT ІРЕЧУКПЕСҒА ТОУҮСКИЕТО РБ--------- 
іххів 150 tvlkgtneqË wgflrdeytt lhketwdrile tdvrdatwowk nfoeglgevres 
TARGET ап вв а ЕНШ 

їхх]В шз ан апайяпвынип hhhhh 
TARGET 492 RDVDFEAIWG AVRDIVLOKF АСРҮрКОЕҮБ PSVOETLYDI QVLSLEOQLPEE 
1хх1В 400 hupkfdatwa каәгеутіксеЕ аей----- по amnvqatmykm aegilarggl 
TARGET hhhhh hhhhhhhhhh h hhhhhhh hhhhhhh а 
їхх]В hhhhhhhh hhhhhhhhhh hh hhhhhhh hhhhhhh s 
TARGET 252 IEDMETSLEMN IHYFHIDMS- КЫЗЦІНК--- EEVLLFLODNEP ҮЗКІТІЗТҮУКЕ 
іхх4Е 245 іесуеувірг khyt=idlow hkglgntgkn аеуҰҒардиеір nglikctvgr 
ТАЕСЕТ оазаопдасоия sap ang PEE | 
ixxjB nassananoqs паз ane абталгп 
TARGET 

lxxjEB 

TARGET 

1хх1 B. 


图 3-4 


SWISS-MODEL 模 建 过 程 ， 目 标 序列 与 模板 的 序列 联 配 
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TO 60 70 50 90 109) 110 120 135 
PTGYCKDHUHVLHJIORDCKYHSTKEWATSYCLTLRSKHDIYLHSCNSD[ITPTDTINNTYHMLAKLROTRNIETFRMNICEHFLSSFNHTRRHVYUEEYP 


图 3-5 SWISS-MODEL 服务 器 提供 的 对 模 建 结果 的 评 佑 《部 分 ) 


联 配 信息 中 包括 目标 序列 与 模板 序列 的 比 对 信息 及 二 级 结构 分 析 情 况 。 
SWISS-MODEL 服务 器 结构 合理 性 评估 有 三 种 方式 ， 分 别 是 原子 间 经 验 平 均 力 势 函数 
Anolea, Gromos 分 子 动力 学 以 及 表示 和 蛋白 质 残 基 与 结构 环境 匹配 程度 的 Verify3D 评估 。 
可 以 通过 点 击 评估 方式 后 面 的 on 及 off 键 来 决定 选择 那 种 评估 方式 ,本 节 中 选择 了 全 部 三 
种 评估 方式 。 

此 外 ， 还 有 模 建 产生 的 日 志文 件 ， 主 要 介绍 模板 搜索 的 过 程 说 明 等 信息 。 限 于 篇 幅 ， 
这 里 不 一 一 列 出 ， 读 者 可 以 直接 通过 SWISS-MODEL 服务 器 预测 之 后 仔细 查看 。 

如果 提 交 的 序列 没有 搜索 到 合适 的 模板 与 目标 序列 的 序列 相似 性 大 于 25%)， 服 务 
器 也 会 显示 搜索 不 到 模 极 的 提示 。 

利用 SWISS-MODEL 执行 蛋白 质 结 构 的 同 源 模拟 ， 操 作 方 便 容 易 ， 但 是 它 仍然 有 一 
定 的 局 限 性 。 

D 优化 不 足 。SWISS-MODEL 执行 结构 模 建 时 ， 为 了 避 倪 因为 得 到 最 低 的 总 能 量 而 
使 结构 的 改变 太 大 ， 因 而 在 进行 能 量 最 小 化 过 程 时 ， 可 能 会 使 能 量 最 小 化 的 步调 (steps) 
减少 ， 相 对 地 结构 可 能 尚未 达到 能 量 稳定 的 状态 。 

(0) 假如 target 与 模版 之 间 序 列 的 一 致 性 必须 达到 25% 以 上 ， 如 果 达 不 到 此 要 求 时 ， 
结构 措 建 无 法 进行 。 

© 措 建 的 Taget 最 终结 构 的 长 度 会 受 限 于 模版 结构 的 长 度 ，Target 序列 比 模板 序列 
中 多 的 氨基 酸 片 段 的 结构 不 会 自动 模 建 。 


第 四 节 利用 Discovery Studio 结构 模拟 系统 进行 同 源 模 建 操作 实例 


Accelrys 公司 的 Discovery Studio (简称 DS) 是 基于 Windows/Linux 系统 、 面向 生命 
科学 领域 的 新 一 代 分 子 建 模 和 模拟 环境 。Discovery Studio 从 原来 的 Insight 三 维 图 形 环境 
软件 包 开 发 而 来 。Discovery Studio 针对 生命 科学 应 用 ， 提 供 生 物 分 子 及 有 机 小 分 子 建 模 的 
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显示 工具 、 功 能 分 析 工 具 、 结 构 改 造 工 具 、 动 力学 模拟 工具 等 ， 帮 助 研究 人 员 在 实验 前 全 
面 了 解 生 物 分 子 的 结构 与 功能 ， 从 而 有 针对 性 地 设计 实验 方案 ， 提 高 实验 效率 ， 降 低 科 研 
成 本 。Discovery Studio 在 揭示 和 蛋白质 结 构 功 能 关系 、 生 物 分 子 结构 模拟 与 动力 学 计算 、 基 
于 上 所 药物 设计 、 抗 体 设计 、 栈 工程、 生物 分 子 间 的 相互 作用 (包括 蛋白 质 与 蛋白 质 、 和 蛋 
日 质 与 肘 、 绰 白质 与 核酸 、 和 蛋白 质 与 有 机 小 分 子 )、 生 物 分 子 核磁 共振 、 功 能 基因 组 以 及 
蛋 日 质 组 等 方面 有 着 广泛 的 应 用 。DS 目前 的 主要 功能 包括 : 蛋白 质 的 表征 (包括 蛋白 - 蛋 
日 相互 作用 )、 同 源 建 模 、 分 子 力 学 计算 和 分 子 动力 学 模拟 、 基 于 结构 药物 设计 工具 СЫ 
括 配 体 -蛋白 质 相互 作用 、 全 新 药物 设计 和 分 子 对 接 }、 基 于 小 分 子 的 药物 设计 工具 (包括 
定量 构 效 关系 、 药 效 团 、 数 据 库 乌 选 、ADME/T) 和 组 合 库 的 设计 与 分 析 等 。 

Discovery Studio 为 用 户 提 供 了 一 整套 利用 Homology Modeling 方法 自动 预测 蛋白 质 
空间 结构 的 工具 。 用 户 只 需要 提供 蛋白 质 的 氨基 酸 序 列 就 可 以 轻松 完成 模型 构建 及 模型 可 
信和 度 评估 的 工作 。DS 的 Homology Modeling 主要 基于 MODELER 程序 。 目 前 MODELER 
己 成 为 学 术 上 使 用 最 为 广泛 、 预测 最 为 准确 的 同 源 建 模 工具 之 一 。 其 主要 的 建 模 步骤 包括 ; 

O 使 用 序列 相似 性 工具 BLAST 或 PSI-BLAST 搜寻 目标 序列 的 模板 ; 

D 使 用 结构 比 对 方法 将 模板 进行 比 对 ， 释 合 ; 

© 使 用 序列 比 对 方法 将 目标 序列 与 模板 结构 的 序列 进行 比 对 ; 

由 使 用 MODELLER 产生 目标 序列 的 模型 ; 

(Б) 模型 的 评估 。 

本 实例 中 使 用 一 个 胞 外 淀粉 酶 的 模型 构建 过 程 为 例子 ， 展 示 如 何 使 用 DS 为 该 淀粉 酶 自 

动 构 建 空间 结构 ， 并 对 所 构建 的 模型 进行 评估 。 


一 、 识 别 模板 ， 比 对 模板 

本 实例 使 用 BLAST 来 搜索 templates. fT BLAST 搜索 时 ， 数 据 库 通常 使 用 Protein 
Data Bank (PDB) 数据 库 。 

1. 载 入 序列 

从 Files к 打开 A SO SN fasta 3-6). 


іміз Tr 
li 


—— í = "= алі" i i ы н а онн на “ ШЫГЫ = maka ш жаны гп т ш U U. U. Le амы Wai h „ЫШ а= — — ш єз э 8 п m ar... ed i —P а — w m s 


图 3 36 从 Files 读 入 序列 


2. BALST PDB ш95 数据 库 ， 寻 找 模板 
(1) 选择 target 在 Protocols 中 , 展开 Sequence Analysis 文件 夹 , 双击 BLAST Search 
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(DS Server)。 在 the Parameters 中 ， 点 击 the Input Sequence parameter， 选 择 Р41131:Р41131 
Input Sequence 中 的 文件 名 为 sequence window 的 名 字 “P41131) 与 该 窗口 中 的 序列 名 称 
(Р41131) 的 名 字 组 合 

(2) 选择 BLAST 数据 库 


= Database 选择 РОВ пг95 (图 3-7) 
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图 3-7 ”选择 数据 库 


(3) 运行 Protocol 


在 Protocols toolbar， 点 击 j> 运行 ， 等 待 计算 完成 
计算 完成 后 ， 会 显示 一 个 Job Completed 对 话 框 (图 3-8)。 点 击 OK. 
(4) 查看 计算 结果 


在 Jobs (作业 〉 中， 双击 the completed job 


这 将 打开 一 个 Htm 的 窗口 (图 3-9)， 里 面包 含 Reprothtm ХР CALA ЕЖ 


报告 )。 


миз - 5ефчалсв Тілден Eeport = Юа] Тізіш Ж 


BLAST Search (05 Server) 


% Desc ription 


= Information 


Маты BLAST Search (DS Sarver) 
абыт сс 
Litir wanga 
DS Version 25.2987 
> ' | DS Chant Marion 25.0.9164 
The BLAST Search ÙS Server)” job has completed | бұлтта сайн (Wirckwan 32) 
Deugbls-click thè jab in the Jobs Explorer to revise thè results. Slart Tim 2005-06-30 3 


Notify ne rhen a job completes Cou |) etre a шы 
3-8 Job Completed 的 对 话 框 39 ”结果 报告 文件 
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Html 窗口 中 ，Output Files 部 分 ， 点 击 the View Results。 这 将 打开 BLAST 搜索 找到 的 
gd 0 
Documents\Discovery Studio Client\Results\BLASTSearchDSServer <time stamp><ID>. 

在 P41131 - Blast 窗口 ， 点 击 该 窗口 下 的 Table View, Table View 显示 了 命中 的 序列 
(图 3-10)。 每 行 表示 一 条 命中 的 氨基 酸 序列 。 在 DS 中 ， 灰 色 的 cell 不 能 被 编辑 。 


Р41131 — Sequence Tinder | Report - Html Tindow | PALLI = Пав Findo Х | 


Т pt: 3 - = = = Fii шы: ee aLi L LERI ә Dm ынасы i r Ea EEA 
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2 Alphw-waylases. ЗІР А (ж 424 зоо 827 2169—12 4 53 1.5 

з АРНА ANTLASE-- 10А 4% 425 291.582 eT 0 53 1.38 

4 МНО-МТІАЕ-- LAELA «ті 405 265. 96 3.440677 4 от 1.65 | 

S “lphacaaylasas 3000,4 422 188 88. 1965 222-і 30 45 2.18 

6 Miphacsaylarsas- ПАТ А 422 168 96. 6557 Т.1225, 9 2145 2.21 

Т CYCIODEYTRIN … 109С А КГ 284 55.6306 15096-06 23 E 1 | 

8 CICLODEXTEIE =- 1PANA вв 294 54.6842 zr N = 1.8 

8 Сүсісені(ойах-- 3BMV_A 2 ваз 288 54, 299 3.544130 23 8 1.6 

|0 СҮСШБЕТЕТЕ = ICGT_A К 231 46. 595 Tat 2 эт 2 

11 4-ALPNA-GLUCA-- 1107 А 441 146 46. 2098 0231456 т 39 2.5 

12 CTCL0DRITEIN = ICTG_A 680 147 44. 2838 0 24 ж” 25 

13 P-L. LWIA 9 106 44 2838 4.4804 -(586 э! 42 2 

14 ALPHA-MBYLASE--- ЛИТЕ А “4 230 42. 3578 бм 24 ` 1.5 

15 BARIPY AILPHA---- ТАМА А 403 255 41. 9726 0000183548 25 41 1.9 v | 
м реа [sms rnana шіт m O rw=s<'a TC = === rm 


: Мар Убаи || Table View | Text View | 


3-10 Table View 


注意 : 命中 的 序列 按照 E 值 进行 升序 排序 。E 值 最 低 的 序列 ， 结 果 最 可 靠 ， 排 在 第 
一 行 。 x 1 

Мар View 将 命中 结果 都 显示 在 一 张 图 中 ， 每 条 线 表示 一 条 序列 图 3-11)。 每 根 横 条 
根据 打分 不 同 而 配 以 不 同 的 颜色 (分 数 超过 400 为 红色 , 最 佳 的 命中 结果 )。 本 例 中 的 target 
P41131 放 在 窗口 的 最 上 方 ， 为 一 条 长 度 为 443 个 氨基 酸 的 直线 。 


Score Color Ker m° шн. ше? pmi? 08190 Е 200 +9 
81 їй 151 341 251 àdi 391 401 


381 
3174 bits (812), Енвесі = 2. 3Je-87 
баз: ійі гава (474), Positivas: 223/381 (SPS). çapa: 14/іші (БҰ) 


Нар Vier Table Vier š Tart Wiii 


图 3-11 Map View 
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用 户 可 以 将 鼠标 放置 在 某 一 个 命中 序列 上 ， 如 下 信息 将 会 显示 (如 图 3-11): 
е 序列 数据 库 的 描述 

° 序列 的 编号 

е 目标 序列 中 的 起 始 氨基 酸 位 置 

° 数据 库 中 命中 序列 的 起 始 氨基 酸 位 置 

• 命中 序列 的 长 度 


这 时 用 户 “ТТТ 口 顶端 target et 的 相应 氨基 酸 . 可 能 需要 放大 几 次 才能 看 见 具体 的 
AERA, 


Telcoma - Иба] Window | Р41131 - Sequence Window | Report – Htal Window | PF41131 - Mast Бейне х | 


— —— шш а 00 ” 


ӛсете Color Хет m gir gE! = m! ğü 120 Ш492 
| ҰЯНБА,ТЫІРШІГИТЕЗСТҮШІШТАТҮКЕТІІСТЫТАРҒТЕТБИЛАКИКАРАВУКАТІТЕАС ӘРЕВАТІЕТІСАРЫ-ЕЗРПІШҢЕР-БАЕҮТТІПТЕТЕРКІРІШ ААНМЕНОЦІКЕТЕТІР-ЕСТЕІІР 
І | | | | | | 


КЕРРИ 
Мар View | Tabla View | Text Vier | 


图 3-12 放大 的 Map View 
ЖШ: Map view 中 命中 序列 的 顺序 并 没有 改变 。 


二 、 将 模板 进行 比 对 

为 了 构建 target 的 3D 结构 ， 需 要 挑选 一 个 或 多 个 合适 的 同 源 模 板 (templates)。 一 个 
理想 的 template 需要 涵盖 整个 target 的 长 度 ， 具 有 较 高 的 序列 等 同性 Sequence identity), 
并 且 E 值 要 够 小 (< 1x10")。 根 据 上 述 原 则 ， 选 用 前 4 个 命中 序列 作为 template. 

” 一般 而 言 ， 若 有 多 条 模板 (模板 之 间 相 似 度 不 能 太 高 ) 与 target 具有 相似 的 同 源 性 ， 
那么 都 将 使 用 名 模板 来 构建 同 源 模型 .这 些 模板 在 核心 区 域 一 般 都 高 度 保守 ,而 在 一 些 loop 
区 的 构象 上 则 有 所 不 同 。target 可 以 与 其 中 某 个 模板 在 某 loop 区 匹配 ， 而 与 男 一 个 模板 在 
另 一 loop 区 匹配 。 因 此 ， 使 用 多 模板 可 使 建 模 过 程 中 模型 的 每 个 部 分 者 能 找到 最 合适 的 
模板 。 

1. 载 入 模板 结构 及 其 与 target 的 比 对 结果 

点 击 P41131-Blast 窗口 ， 点 击 Map View， 按 住 SHIFT 键 同 时 点 击 前 四 个 命中 序列 
1694 A、3DHP A、1HX0 А. 1ЈАЕ A, ЖН, т, М Load Structure апа 
Alignment, ТЕ DS 中 打开 两 个 新 的 窗口 。 一 个 为 新 的 3D ИП, 1020 1694А, UST 
上 述 四 个 模板 结构 的 A 链 以 及 结构 中 的 水 分 子 和 配 体 分 子 〈 图 3-13)， 另 一 个 为 序列 比 对 
窗口 〈 记 为 Sequence)， 包 含 了 目标 序列 P41141 和 四 个 模板 结构 的 序列 比 对 图 (图 3-14)。 
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图 3-3 模板 结构 窗口 
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图 3-14 序列 窗口 


2， 查 看 二 级 结构 和 BLAST 比 对 结果 

在 Sequence 中 点 击 右键 并 选择 Secondary Structure Cartoon 

四 个 模板 序列 的 下 方 会 出 现 根据 PDB 和 Kabsch-Sander 两 种 分 类 方法 进行 分 类 的 该 序 
列 的 二 级 结构 图 。 红 色 横 条 表示 a 螺旋 ， 蓝 色 箭 头 表 示 B 折 县 (图 3-15). 

检查 目标 序列 与 模板 间 的 比 对 结果 。 发 现 C 端 中 约 有 50 个 氨基 酸 没有 比 对 上 。 这 样 
的 比 对 结果 不 适合 用 于 同 源 建 模 ， 需 对 序列 进行 重新 比 对 。 

3， 模 板结 构 间 的 结构 比 对 

序列 保守 性 和 结构 保守 性 通常 来 说 有 所 不 同 , 所 以 序列 比 对 的 结果 常常 与 结构 比 对 的 
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结果 不 同 。 对 于 同 源 建 模 来 说 ， 在 模板 与 target 进行 比 对 之 前 ， 最 好 能 将 模板 基于 其 结构 
的 相似 性 先进 行 一 次 比 对 。 
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图 3-15 模板 二 级 结构 分 布 图 


在 Protocols 中 ,展开 Protein Modeling 文件 夹 , 双击 Align Structures (MODELER). 
在 参数 Parameters 中 ， 单 击 Input Sequence Alignment 并 选择 Sequence。 展 开 Input 
Sequence Alignment A HAMA +” S), 可 以 观察 到 四 个 蛋白 质 结构 1G94A.3DHPA. 
IHX0A. 1JAEA 自动 填充 到 Input Protein Structures 里 面 。 


reata yaw О 


i 1 5 à . 
| Fi Малын ьш ы ши HL ` - , fk] 
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在 Protocols toolbar rh, Ati, 等 待 计算 完成 

在 Jobs 中 ， 双 击 completed job 

结果 文件 Reporthtm 将 显示 在 一 个 新 的 Html 窗口 里 。 

4. 查看 结构 比 对 结果 

在 该 Html 窗口 中 ， 滚 动 页 面 至 Summary 部 分 ， 可 以 查看 每 对 结构 之 间 两 两 比 对 时 
的 主 链 RMSD 值 以 及 比 对 的 氨基 酸 数量 。3DHPA 与 ІНХОА 非常 相似 ， 两 者 之 间 比 对 了 
496 个 氨基 酸 , RMSD {hF 0.5 А. 1694А 和 1JAEA 与 其 他 蛋白 则 不 那么 相似 (图 3-16). 
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点 击 View Results。 这 将 打开 两 个 新 的 窗口 。 一 个 为 序列 窗口 ， 里 面 有 模板 序列 的 比 
对 结果 {图 3-17)。 另 一 个 为 3D 窗口 ， 着 合 后 的 模板 分 子 都 在 该 窗口 中 。 所 有 苑 合 的 结构 
都 只 以 CHRR (stick) 形式 显 示 出 来 (图 3-18)。 观 察 这 些 结构 的 番 合 找 出 它们 不 同 的 
地 方 。 


ТЕН Жан кш 
图 3-17 模板 序列 的 比 对 结果 
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三 、 将 目标 序列 与 模板 比 对 

同 源 建 模 中 , 根据 目标 序列 与 模板 的 相似 性 可 以 选用 不 同 的 比 对 方法 将 目标 厅 列 与 模 
板 序 列 进行 比 对 ， 当 模板 与 目标 序列 的 同 源 性 很 高 时 〔 序 列 等 同性 超过 50%), BLAST 可 
以 清晰 地 识别 正确 的 模板 ，tar 费 板 序列 间 使 用 简单 的 序列 比 对 就 能 获得 很 好 的 比 对 
效果 ; 当 序 列 相似 性 不 高 但 仍 高 于 twilight 区 (序列 等 同性 为 25%--50%) BF, 虽然 BLAST 
还 是 能 够 识别 出 正确 的 模板 ， 但 是 ， 简 单 的 多 序列 比 对 已 不 再 能 够 产生 正确 的 比 对 结果 。 
可 以 通过 生成 序列 profile 的 方法 来 改进 序列 比 对 结果 ; 若 序列 相似 性 低 于 25%， 必 须 使 用 
PSI-BLAST 来 识别 模板 ， 而 且 必 须 使 用 序列 profile 来 比 对 target 和 template, 

由 于 本 实例 中 的 target 与 template 的 序列 等 同性 为 25%—60% 《最 好 的 template 为 
47%)， 所 以 采用 第 二 种 比 对 方法 。 一 个 好 的 序列 profile 必须 包含 大 量 非 元 余 的 同 源 序列 
比 对 结果 。 

本 实例 中 ,分 三 步 将 target 与 模板 进行 比 对 : © 利用 BLAST 搜索 UniRef90 数据 库 ， 
寻找 target " 利用 多 重 序列 比 对 将 target 与 命中 序列 进行 比 对 ， 产 生 第 一 个 
2 中 产生 的 profile 与 模板 比 对 所 产生 的 profile 再 进行 比 对 。 


序列 ЖҮРЕ 
е” ы 


序列 了 P41131 Ea sequence еп 中 打 T. 现在 ， 需要 用 BLAST Search(DS Server)Protocol 
来 搜索 UniRef 90 数据 库 。 

2， 设 置 Protocol 参数 并 运行 Protocol 

在 Protocols 中 ， 展 开 Sequence Analysis 文件 夹 ， 双 击 BLAST Search (DS Server) 
protocol。 提 示 关 闭 已 经 打开 的 protocol 时 ， 点 击 Yes。 
点 击 арш Database， 选 择 UniRef 90. 
将 E-value Cutoff 更 改 为 0.0001， 将 Maximum Hits s EAA: 500. 


Para га a Hi a Е EEEN r канн) ен Д РНИ ЕНИН 
Ж Е Sadoence | ҚЫНДА C 
| лра Seoring Matrix 1 amma 2. зш. — — :BMD == малый ш-і----ы... 2- ыд жаз 5 асал аата 
| 98 деше. a үа. 11 Extension: 1. 

= E-value Cutoff в 0001 | Е ТЕКТЕС 
| Filter Low F P „Бэ кыйыны кайый 


在 Protocols toolbar 中 ， w 等 待 计算 完成 

计算 完成 后 ， 在 Jobs 中 ， 双 击 完成 的 工作 

这 将 使 结果 文件 Report.htm 显示 在 一 个 新 的 Html 窗口 里 。 

3. 查看 结果 

在 该 Html 窗口 中 ，Output 文件 部 分 ， 点 击 P41131 profile pir， 这 将 打开 一 个 新 的 序 
列 窗口 ， 里 面 是 BLAST 搜索 UniRef 90 数据 库 的 结果 (图 3-19)。 

4. Ж target 与 BLAST 命中 序列 重新 进行 多 序列 比 对 

在 Protocols 中 ,展开 Sequence Analysis 文件 夹 , 双击 Align Multiple Sequences protocol, 
点 击 Input Sequence Set parameter， 选 择 P41131 profile ( 3-20)。 
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Р41131 = Sequence Mindomw | Eeport = Himl Window I Р41131 profile = Бедшепсе Жіпіз x | із ыы енде Pa, 


20 30 40 50 вй 
PF41131 SFSHIKSAEGYVBVHLFEVKFEDBEAHECETYLGPKGFGGREQ ҮСІЕРРЛІНКО 
| ADKGIB 5РЕНТАТАЕСҮНУНІРОТЕРНІШАНЕСЕТУІСРЕСРОСИЦІТШ РАЕНЕС 
А45БА2 г ЖЕНЕСРбЕНТАТКЕСУНУНІРОТКРИПИККТЕСТЕРІСТЕСТСЕШСІТШРАЕНЕС 
0440672 Se A a A - Ко ЙА ХКІСШТСУСбАКСРСОИОУҮТШРАСТЕЕ 
| ӘККЕ5 | AQSSYIKGTAFVHLFEYVSWHEDBADECEMHFLGPKGFDARQISHBPETEEVE 
Q3DYP7 "--""------------ -АӘТБЕРЕТҰҮРҮНІШРЕТЕТТІШАЦЕСЕНЕІСРЕСРААШОҮСШРОЕКАҮ 
goeze Ea АВЫРЫ ЕЕ Ере ЕЕ ЕЕ ЕЦЕ ЕЕ ҮНІРЕТЕТАПИАЛЕЕСЕТРІСРКСТТАЙОҮЗШРНЕНІС 
МГАЗ4 Y a a е а ААРТТРУКІРЕТИТОТЩАТЕСЕТРІСРКСТАЛ СОУ ЩРУЕКУТ 
ОСТЕО Г ере на еш эшче эш шош ш шеи ы йды -—F V MLFEWKWUTHHRAKECENWVLOPKGFA RABEQ SMFIENIN 
QISRXI знана а шер ы шшш -Т@55ААРТТЕУНКЕЧ Н ОП АТЕСЕТЕТСРКСТАА ОЕҮСЕРЕШЕНІТ 
091419 (лла аши еуин E жүнүн эщ чэн жна РҮНҤНТЕКЕЕЧ ЫШТ ЕПШШАЦШЕГЕНТСРЕСРКАШ ШҮСШЕРСЕНІҢ 
F29957 [т=ш= ш жее ыу шат елы жазышы = “ТЁҮНТЕЕЧТ НК ЫЛ ШАШЕГЕШТТСРКЕКСТААШШПҮ5СЗШ EHIT 
тоюм |е -ҮТІҮКІРЕТСТЕПШАТЕГСЕЕРІСРТСЕРСӘОШ ІЗШРИЕНІП 
АТ2С9 3-“--“""“"-“---"----------- РҮНІРЕНРЗСЕРІ АШЕСІСШРІСРЕСТАА  УСИРИНЕНІТ 
Ru r П------------------------ -КІУНЕІРЕЖРТЕПТШАКЕРСЕЕРІСРТСОРСОИСІЗШРИЕНІСЗ 
' P00688 жайа антин и аш на ақса -—HTSDGRIKIVHLFEYVRYVVDBAKECERYLAFKGFGGREQ VSE EER HH 
| 096027 1 БОТО ЕЛВИН ыш лы мша ш HHFAÑQÑGRHETIVHLPFEYWVKRWYDARASECEMRFLGFPFKGF A GEQVSEEPNENSVY 
GMY AG 让 НҮНІРЕЧТКТШІПИАЛІСЕНГРІСРЕСЕКСИ СҮЗШҮШЕЛАЗ 
QERSHI |! СОЕ ды танады дады ды 5ЕТПӘСЕТСТҮНІРЕТЕТҮТПИАТЕСЕКТІЛГІКСОГІССОИЯҰ5 РЕЖЕЕНІШ 


Ё 3-9 BLAST 搜索 UniRef 90 数据 库 的 结果 


ma TN мы „Жог. ы шы "з. de Балта. = o im B ra ллы агарса тасын 
| BLAST Search (DS Server) | Align Multiple Sequences X 


| зде Hame | Parameter Value x 


a 


| Alignment Туре Align Sequences 
| Irput Sequencxs А1 епі | БЕККЕ 

Input Sequence Set | ||| В4131 profila 0 
由 Pairwise Alignment Fast 


| Multiple Alignment Scoring Mate BLOSUN 
Multiple Alignment Сар Dpen Fe» 10.0 

| Multiple Alignment (тар Extensi"! 0.05 

| 


| Delay Divergent 40. Ü 
由 Special Gap Penalties 2 
Ж Use Secondary Structures 2 Hone 


图 3-20 ”序列 比 对 参数 


在 Protocols toolbar F, Air 运行 ， 等 待 计算 完成 。 计 算 完成 后 ,在 Jobs 中 ， 双 击 
“completed job”, 这 将 打开 一 个 Html 的 窗口 (图 3-21), 里 面 为 比 对 的 结果 文件 Reporthtm。 


e | Report - Htal Window | P41131_profile - Sequence Window | Report - Htal Window 0) X] 


Align Multiple Sequences 


+ Description 


= Information 
Hame Align Multiple Seguernces 
Біл SUCCESSI 
User warvgzl 
DS arusaru 2.5 0.9167 
DS Client Version 2.50.9164 
Syster localhost Añiridouzs32) 
Shart Тито: 2013-06-30 15:03:53 
Finish Time 2073-06-30 15106106 


Ехасцйісп Тепе 00:01:13 


3-21 序列 比 对 结果 报告 
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5. 将 本 轮 序 列 比 对 的 profile 与 之 前 模板 结构 比 对 的 profile 进行 比 对 

在 Html 窗口 中 ，Output Files 部 分 ， 点 击 P41131_profile.bsml 打开 序列 比 对 结果 。 在 
Jobs 中 ， 双 击 之 前 已 经 完成 的 Align Structure (MODELER) 计算 打开 Report.htm 文件 。 在 
Html 窗口 ，Output Files 部 分 ， 点 击 View Results 打开 序列 比 对 序列 比 对 结果 和 看 合 后 的 
结构 ,在 Protocols H, 展开 Sequence Analysis 文件 , 双击 Align Multiple Sequences protocol, 
点 击 Alignment Type 选择 Align Two Profiles， 点 击 Input Sequence Alignment 选择 
P41131 profile я 13-22), Кылаан аннан 选择 Sequence, 


i тишина ma mm mm a mamam тш шш=н п шшш п nm ш =555 


Parameter Name 


тт Mee ki e E e i`; ЖЕ. m n ЭРЛА S L LL ee .LLL Ul 


Farameter Yalue 


; Mignen Ты Alien Two Гари i 
Wlnput Sequence Мішлері F41131 profile 
Input Sequence Set Sequence 
由 Pairwise ALiEmnment | Fast 


Multiple Alignment Scoring Май” BLOSUM 
Multiple Klignnent Сар Орел Pa” 10.0 
Multiple Klignment Сар Ехіепві""" 0. 05 


Delay Divergent | 140. 0 
国 Special Gap Penalties 
由 Use Secondary Structures Hone 


图 3-22 profile-profile 比 对 


计算 完成 后 ， 在 Jobs 中 ， 双 击 completed job， 打 开 Report.htm 文件 。 

在 Html rB, Output Files 部 分 ， 双击 P41131 profile-Sequence.bsml 打开 序列 比 对 结 
果 。 将 序列 比 对 结果 P41131_profile 与 模板 结构 比 对 结果 Sequence 进行 profile-profile 比 对 。 

б. 查看 profile-profile 比 对 结果 

计算 完成 后 ， 在 Jobs 中 ， 双 击 completed job， 打 开 Report.htm 文件 。 在 Html 中 ， 
Output Files 部 分 ， 双 击 P41131_profile-Sequence.bsm] 打开 序列 比 对 结果 (图 3-23)。 


| Sequence - Molecule Window | Eeport - Htal Window (2) ' P41131_preofila-Seguenre = Sequence Window X ; үш 
| 10 20 30 40 50 60 “| 
| 241131 КЕЙСЕРЗ5НТАЗАКЕСУИҮНІРЕНТКРИПІКНЕСЕТУІСРЕСЕСЕЙШҮЗСШРАЕНЕН | 
| AORGI8 ЖЕЙС5РЗНТАТАЕСУИУҮНІРШЕКРЕПІАНЕСЕТТІСРЕСЕОСЙИЦІТИҒАЕНЕН | 
| MSRAZ SS TI | 
| Qa4062 > баш ыйказы ы ныкына ыы ыы E Жайына Ан асай была битан КОҮАКЕСЫТСҮСАКОРК ОССЕ ЕП ҮТ РАСПАЕ | 
| @ЭКК55 =з шасын е ннн шуы туша ҺО5$5$ТАбСТАРҮНТҮЕЯ5ТНПТАПЕСЕКНЕПСРЕСЕПАШ ОІСШРТЕНҮК 
| Q3DTPT еже ыш шша ыыы ш ж ыш ЛОТЬБРЕТУРУКНІРЕЖКЕТОІАЦОЕСЕНРІСРЕСРГАЛ ачу ЩРСЕНАУ | 
Í goarre | абр ne EE ҮКНІРЕТКТАПУАКЕСЕТРІб6РЕСІТТАЙ УҮЗШЕРЕЕКІЗ | 
| ACAH Н--------------------- “АЖАРТТРҮНЫРЕТЕТОИПУРАТЕГЕТРІСОРЕСТААЛШОУЗИРИНРНУҰТ | 
l guro /|-------------------------- -БҮНІЛЕТКЕТПІЛКЕГЕНРІСРЕСРАЛ УЗИ РдІЕНІСӘ: | 
jamu | |Ң------------------ 145 ЗААРТТРҮНЫЛЕНЕЖОВІКТЕСЕТРІОРКСТАА ус рРзЕкІТ | 
[ma  |-----------%--<----------- -БҮНІЛЕТСТЕРРАЦЕСЕНТІСРЕСРЕА УС РдІЕКІЗ | 
| PF28957 | --------.-.....-........-..-..-...- ТРҮНПТГРЕТИЕТОФВУКОЕСЕЙТІСРЕСТАА УЗИ РИРНІТ | 
| UPT00D0F46582 =-= =-= == == == == == ш ш ш м ш — - - - - - - ҮІҮНІДҒТЕТЕТЕТІЖЕЕГЕІПРІСРТСЕССЕСТЕШРНЕКНІРП | 
| aptata | там анан кана енна S FYHLFEWSYVYPDVANÑECEQFLGPEGTA K ШОУ ШРЕК ИГТ | 
ШЮЖЮИҒҒ e — — = = = = === === === ---- - - = YVIYHLRFREWPITHDIKEECERFLGPYGFGGREQISBPHEMRMIS | 
| P00688 | ----------------... НТЕФПСЕТАТҮНІРЕЗТЕТУШПІХЛКЕСЕЕКТКПАРЕСРОСИОУСИРИЕННИ | 
| QARET | mus m s жш жы жш шш шшш СЕНРАООФВЕТТУҮНТРЕТИТОАТА5СЕСЕЕРЬОСРЕСРАб йау рикн<ү : 
| ENT | ОВ ааа үн жылш лш ан ыш аел ici ае чш ОВИ ИКЕ ыы реа ы кыы ы Q YŠ ыыы a т 
H тус; гыз сты Б - а аьа ss. ME. чй 4ч то т a лыт ш оллот- ға ш PE. n. s ыы # оз оты mr mn ГИТЕ WE қ, ят m s яя яя m. 


图 3-23 profile-profile 比 对 结果 


四 、 使 用 MODELER Hit E RFID 模型 
在 本 小 节 ， 将 使 用 上 小 节 产生 的 如 对 绪 某 档 姨 月 枚 序列 P41131 的 3D 模型 。 
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在 Protocols tH, 展开 Protein Modeling 文件 ， 


双击 Build Homology Models， 在 


Parameters 中 ， 点 击 mput Sequence Alignment ， 选 择 P41131 profile-Sequence。 展 开 Input 


Sequence Alignment, Mii Input Model Sequence， 选 择 P41131， 点 击 Input Template 
Structures, ЖЕЕ 4 个 模板 1G94A、3DHPA、1HX0A、1JAEA， 点 击 Optimization Level 
(E 3-24), Ж low GH “Optimization Level” 改 为 Low， 可 加 快 计算 速度 ， 但 产生 的 模 


SIDE FEE). 


Te Wes Т : 


; = Input Sequence npp 
| Input Model Sequence 
| Input Templata Structures 
上- Cut Üverhangs 
Disulfide Bri ГЕНЕ 
Cis-Prolines 

Additional Restraints 
Copy Ligands 

Copy Chains 

lE Reference Template 

IE Huber of Йод 


|% Refine Loops 


True 


i панин н ни ни н н пи н 8 тоннан т НН Н 
— др Fr 


ҮН Parameter Value 


соо нң шені НЕШЕ ИЕ HER | 
P41131 | 
1694А, 3DHPA, 1 ЮХОА, 17АЕА | 


Ра] se | 


图 3-4 构建 模型 参数 


在 Protocols toolbar 中 ， 点 击 > 运行 ， 等 待 计算 完成 。 
计算 结束 后 ， 双 击 Jobs 中 completed job 打开 Report.htm 文件 。 
Reporthtm 文件 (图 3-25), Output 部 分 ， 点 击 P41131.B99990002.dsv 打开 所 建 5 个 模 


型 中 的 第 一 个 模型 (图 3-26)。 


| Sequence ~ Molecule Window | Report - Html Window 0) | 


| Е Description 
= Information 

Мате Build Homology Models 
айл Success 
Lizer Warga 
DS Version 2.5.0,9157 
DS Client Version 2.5.0.9164 
System оса оті (Wiradkooor32) 
Start Time 2009-06-30 15:22:06 


2009-06-30 15:35:00 
Ежесійоп Тіпті (00:12:54 


| | Build Homology Models 


ЕЗІ profilecSegusnes - Sequence Window | Report - Міні Window 0) X 


3-25 ”模型 构建 结果 report 文件 


五 、 模 型 评估 


模型 构建 完成 后 ， 需 要 对 其 进行 评估 。DS 为 用 户 提供 了 多 种 模型 评估 方式 。 主 要 和 包 
括 : PDF (probability density function) Energy. DOPE Score, Ramachandran Plot 和 Profile-3D, 
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1. 使 用 PDF energy 评估 和 挑选 模型 

建 模 过 程 中 , DS MODELER 首先 会 
提取 模板 〈template) 的 几何 特性 ， 然 后 
使 用 PDF 函数 来 定义 蛋白 结构 中 请 如 键 
К. BA, BASILARE RECS 
对 PDF 函数 施加 一 定 的 约束 条 件 ， 并 以 
此 来 构建 target 的 3D 结构 。 所 以 PDF 的 
函数 值 可 以 直接 反映 所 构建 模型 的 好 坏 。 
一 般 PDF Total Energy 越 小 ， 表 明 模 型 能 
更 好 地 满足 所 提取 的 同 源 约束 条 件 , 模型 
的 可 信和 度 越 大 。 图 3-26 ” 模 建 的 5 个 模型 中 的 第 一 个 模型 

2， 查 看 所 有 模型 的 PDF 值 并 根据 该 值 选取 最 优 模型 

Report.htm 文件 窗口 ，Summary 部 分 (图 3-27) 

该 部 分 有 一 个 表格 ， 表 格 中 给 出 了 模型 的 PDF Total Energy. PDF Physical Energy É 
DOPE Score。 模 型 排序 时 按照 PDF Total Energy 升序 排列 。 


= Summary 
Modeler Version : 93/4 
Model: Sorted by PDF Total Energy 


— = rum —. S БЫР" кийийн =т= Ыыы к танысы LIS E E 


— ы ж — —— рур == == ош == зи пш шшш = "s. = =m = —— ipu pia rra 
ШЖ —Fn В А шш ый "ЫЙ — " — Г ҥш. п ии та 


р41131.899990002 14404.01 11245.35 О 43028.44 | 
ра1131,899990005 (14512.22 127738 403841 
Р41131.899990003 14513.43 12507 0 2433544 Т 
р41131.899990004 [145951 зз 437521 | 
р41131.899990801 14402200 15765 elzz65 00 


图 3-27 评估 的 Summary 部 分 


从 图 中 ， 可 以 发 现 ， 模 型 P41131.B99990002 为 最 优 模 型 (PDF Total Energy 值 最 低 )。 

3， 使 用 DOPE Score 评估 和 挑选 模型 

DOPE 是 一 个 基于 原子 统计 势能 的 程序 ， 主 要 用 于 模型 评估 。 它 的 分 数 可 以 认为 是 衡 
量 同一 分 子 不 同 构象 可 信和 度 的 标准 ， 能 够 帮助 选择 预测 结构 的 最 优 模 型 。 分 数 越 低 ， 模 型 
越 可 靠 。 

4. 查看 所 有 模型 的 DOPE Score 值 并 根据 该 值 选取 最 优 模 型 

Report.htm 文件 窗口 ，Summary 部 分 “图 3-27) 

从 图 中 可 以 看 到 ， 模 型 P41131.B99990004 为 最 优 模 型 。 
Ж. 本 实例 中 , DOPE Score 挑选 的 最 优 模型 与 поарно eu an 
一 致 。 所 以 需要 其 他 评估 方法 对 模型 进行 评估 和 挑选 。 O | 

5， 使 用 Ramachandran Plot 评估 模型 

Ramachandran Plot 用 于 阐述 蛋白 质 或 肽 立体 结构 中 肽 键 内 a 碳 原 子 和 准 基 碳 原 子 间 
的 键 的 旋转 度 (р) 对 а 碳 原子 和 氨 原 子 避 的 键 的 旋转 度 ‘phi)， 主 要 用 来 指明 重 日 质 
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或 肪 类 中 氨基 酸 的 允许 和 不 允许 的 构象 。 
通过 对 已 知 晶 体 结 构 的 统计 分 析 ， 可 确定 氨基 酸 在 Ramachandran Plot 中 经 常 出 现 的 

区 域 。 使 用 该 图 ， 用 户 可 以 确定 结构 中 每 个 氨基 酸 的 构象 是 否 正 确 。 本 小 节 只 选用 所 构建 

的 5 个 模型 中 的 1 个 (P41131.B99990002) 为 例 ， 显 示 如 何 调用 Ramachandran Plot. 
Chart 菜单 ， 选 择 Ramachandran Plot (图 3-28) 


图 3-28 Ramachandran 图 


蓝 色 区 域 为 “最 适 区 ”， 该 区 域 含 有 的 氨基 酸 个 数 越 多 ， 结 构 越 可 信 紫色 区 域 为 “人 
许 区 ” 其 他 区 域 的 点 《红色 ) 为 psi-phi 构象 不 合理 的 氨基 酸 ， 可 能 是 建 模 的 错误 区 ， 需 
要 优化 。 ° 

6. 使 用 Profile-3D 评估 模型 

Profile-3D 是 加 州 大 学 洛杉矶 分 校 CUCLA) 的 David Eisenberg 开发 的 一 种 基于 “ 穿 
线 ”(threading) 法 的 模型 评估 程序 。 该 方法 采用 3D-1D 的 打分 函数 来 检测 所 构建 模型 与 
目 身 氨基 酸 序 列 的 匹配 度 关系 。 分 数 越 高 ， 说 明 同 源 模 型 的 可 信和 度 越 大 。 本 小 节 只 选用 所 
构建 的 5 个 模型 中 的 I 个 (P41131.B99990002) 为 例 ， 显 示 如 何 使 用 Profile-3D 评估 模型 。 

(1) 调用 符 评 估 模 型 

点 击 Build Homology Models - Html Window 使 之 激活 ,该 Html 窗口 中 , Output Files 

部 分 ， 点 击 P41131.dsv 
Output Files 
Annotated Model Siructure P31121.B99990001 ds v 


Annotated Model Structure Р41121,99930002 кізу 
Annotated Model Structure Р41131,839930003 diy 
Annotated Model Siructure P41131B939390004 dyv 
Anmotated Model Structure Р41131.6999900065 drv 


Best Model Structure Superimposed to Templates Р41131 ісу 
Sequence Alignment of Models to Templates Р41131 Sequence, 
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这 将 打开 一 个 新 的 3D 窗口 。 里 面 有 最 优 模型 结构 (由 MODELER 中 的 PDF Total 
Energy 确定 ) 与 所 有 模板 的 结构 。 

该 模型 与 模板 已 经 进行 状 合 ， 且 以 ribbon trace 的 方式 显示 。 模 型 中 ， 总 PDF 分 数 不 
同 的 区 域 以 不 同 的 颜色 和 ribbon 厚度 显示 。 观察 结构 , 可 以 快速 地 识别 模型 中 不 可 信和 区域 
(红色 )。 模 板 的 ribbon 则 根据 二 级 结构 上 色 (图 3-29)。 


Sequence 一 Molecule Window ' Report ~ Html Window (3) | P41131 - Molecule Window X | 
+ Е Р41131 ВЧЗ920002 


= МІ Ta 
+ 


图 3-29 ”最 优 模型 与 模板 的 结构 


(2) 计算 模型 Profile-3D 分 数 
在 Protocols 中 ，Protein Modeling 文件 夹 ， 双 击 Verify Protein (Profiles-3D)。 在 
Parameters Explorer 中 , 上 点击 Input Protein Molecules ， 只 选择 
P41131:P41131.B99990002， 在 Protocols toolbar 中 ， 点 击 敌 运行， 等 待 计算 完成 


Jobs 中 ， 双 击 Verify Protein (Profiles-3D) job 打开 Report.htm 文件 。 关 闭 Р41131- 
Molecule 窗口 ， 提 示 保 存 时 选择 不 保存 .在 Htm 窗口 中 ，Output Files 部 分 ， 点 击 
P41131.B99990003.dsv 
这 将 打开 一 个 名 称 为 P4113.B99990002 的 新 的 Molecule 窗口 。 里 面 的 结构 用 不 同 宽度 


的 solid ribbon 显示 ， 并 根据 Verify Score (得 分 越 高 ， 结 构 越 好 ) 着 色 。 颜 色 的 范围 由 蓝 
到 日 再 到 红色 。 蓝 色 对 应 高 分 区 ， 白 色 为 平均 分 数 区 域 ， 红 色 为 低 分 区 〈 图 3-30)。ribbon 
的 宽度 则 与 Verify Score 的 趋势 相反 (结构 越 差 ，ribbon RÈ). 

(3) 查看 结果 

TE Data Table View rh, 点击 Molecule, 滚动 至 the Verify Expected High Score. Verify 


Expected Low Score 以 及 Verify Score (图 3-31) 
Verify Score 越 高， 模型 的 质量 越 好 。 
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1 Summary 
P.41131.B99990002 Verify Score = 171.25 
Р41131.899990002 Verify Expected High Score = 195.312 
P.41131.B99990002 Verify Expected Low Score = 87,8902 


图 3-30 ”评估 模型 的 solid ribbon 图 3-31 评估 分 数 的 Summary 


(4) 使 用 图 性 查看 每 个 氨基 酸 的 分 数 
At AminoAeid， 滚 动 至 尾 列 Verify Score, Air Verify Score 的 题 标 选择 整 列 
(图 3-32) 


图 3-32 ”模型 中 每 个 氨基 酸 的 分 数 表 


从 menu 中 选择 Chart | Line Plot。 这 将 打开 一 个 新 的 图 表 (图 3-33)， 图 表 中 每 个 氨基 
酸 的 score 都 显示 出 来 。 注 意 C 端 和 存在 两 个 loop 的 低 分 区 。 
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3-33 ”模型 的 评估 分 数 图 
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(5) 查看 低 分 区 的 氨基 酸 
点 击 P41131.B99990002-Line Plot 窗口 使 之 激活 , 点 击 拖 搜 low score peak 周围 区 域 ， 
以 选择 Line Plot 中 对 应 的 氨基 本 | | | | 

选中 的 氨基 酸 在 分 子 窗口 中 会 被 标示 出 来 (图 3-34)， 可 以 便捷 看 到 低 分 的 比 对 区 域 。 
Profeile-3D 图 中 选中 的 低 分 点 对 应 的 氨基 酸 在 分 子 窗口 中 直接 显示 出 来 (黄色 )。 


图 3-34 低 分 区 的 区 域 
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从 理论 上 讲 ， 一 个 多 肽 链 可 能 采取 的 构象 的 数目 可 以 是 个 无 限 大 的 数字 ， 但 实际 上 ， 
这 些 构象 中 的 绝 大 部 分 都 是 能 量 不 利 的 ， 也 就 是 在 自然 界 中 根本 不 存在 的 。 许 多 学 者 对 自 
然 界 中 可 能 存在 的 蛋白 质 折 释 类 型 (fold) 数目 作 了 估计 。1992 年 Chothia 估计 自然 界 中 
折合 类 型 数量 不 会 超过 1000. 1998 年 我 国 科学 家 王 志 新 院士 作 了 更 精确 的 估计 ， 认 为 仅 
有 654 种 折 释 模式 和 1000 种 结构 超 家 族 存在 。 此 外 ， 还 有 其 他 一 些 专家 对 自然 界 中 存在 
然 界 可 能 存在 的 折 酸 类 型 的 具体 数目 估计 有 不 同 的 结论 ， 但 是 大 家 对 这 个 问题 的 看 法 有 一 
学 观点 是 共同 的 ， 即 目 然 界 中 存在 的 蛋白 质 折 和 登 类 型 是 个 有 限 的 数字 ， 而 且 折 县 类 型 数量 
大 概 不 会 超过 几 千 种 。 对 已 经 测定 的 蛋白 质 结构 进 行 统计 分 析 可 以 发 现 ， 序 列 不 同 的 蛋白 
质 可 能 杀 用 相似 的 折合 模式 。 很 多 未 知 结构 的 蛋白 可 能 具有 与 PDB 中 的 分 子 具有 相似 的 
结构 ， 但 是 目前 没有 序列 的 同 源 信息 可 以 识别 这 种 关系 。 

折 全 模式 识别 的 原理 是 识别 出 与 一 个 给 定 的 问 询 序列 相 匹 配 的 折 秋 模式, 也 就 是 说 不 
是 用 序列 来 预测 折 肥 模式 ， 而 是 折 秋 模式 要 与 序列 相 一 致 。 这 涉及 几 个 过 程 ， 在 一 个 已 知 
的 被 称 为 折 萄 库 的 蛋白 质 结构 库 中 的 搜索 ， 为 折 县 模式 打分 以 及 识别 适合 序列 的 折 曼 模 
式 ; 将 问 询 序列 与 打分 最 高 的 蛋白 质 进行 序列 比 对 。 一 旦 识别 到 了 这 样 一 个 模板 ， 过 程 余 
下 的 部 分 与 比较 模 建 的 过 程 相同 。 | 
折 营 模式 识别 方法 常常 是 基于 序列 相似 性 搜索 和 结构 信息 这 两 方面 . 例如 ,3D-PSSM 
(three-dimensional position-specific scoring matrix， 三 维 位 置 特异 的 打分 矩阵 ) 方法 利用 了 
PSI-BLAST 算法 来 发 现 与 问 询 序列 关系 较 远 的 序列 ， 并 用 结构 的 信息 来 补充 这 种 搜索 ， 结 
构 方 面 信息 包括 二 级 结构 预测 和 政 水 氨基 酸 具 有 存在 于 蛋白 质 结构 内 核 的 趋向 。 折 登 模 式 
识别 方法 可 以 用 来 探测 远 源 关系 的 序列 ， 但 是 其 结构 预测 的 准确 度 受到 序列 比 对 误差 的 
限制 。 

ЖЕРТ АЛАЯ) (fold recognition) 技术 可 以 确定 未 知 结构 的 序列 对 应 的 折 笃 
模式 ， 或 者 评价 一 个 序列 是 否 与 已 知 的 折 又 模式 库 中 的 一 个 结构 兼容 。 这 项 技术 由 多 家 实 
验 室 发 展 而 来 , 所 以 有 很 多 名 称 , 如 反 向 蛋白 质 折 又 (inverted protein folding)、3D-profiles、 
Threading 方法 、 序 列 -结构 兼容 性 搜索 (sequence-structure compatibility search) Ж. 

H: 有 有 多 种 基于 蛋白质 折 有 登 模 式 识别 预测 蛋白 质 结构 的 方法 。 目前 利用 折叠 识别 预测 
条 日 质 绪 构 的 主要 方法 大 多 是 从 1991 年 Bowie 等 提出 的 三 维 训 面 〈 3D-profiles) 方法 和 


1992 年 Jones 等 提出 的 Threading 方法 发 展 而 来 的 。 
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Threader 是 英国 伦敦 大 学 的 David Jones 创立 的 常用 折 又 模式 程序 ， 曾 经 在 第 一 届 和 蛋 
白质 结构 预测 技术 的 鉴定 评估 (The Critical Assessment of techniques for protein Structure 
NUR EFF, 2 


Prediction, CASP) 竞赛 中 取得 优异 的 表现 ， 被 认为 是 比较 成 功 的 折 和 又 
程序 对 于 学 术 用 户 是 免费 的 ， 可 以 从 互联 网 上 下 载 。 目 前 程序 最 新 的 版 本 为 Threader3.0 
在 本 章 的 下 面 内容 中 将 以 幽门 螺杆 菌 ]pp20 RAAH: 介绍 THREADER 程序 的 使 用 方法 ， 
包括 程序 的 安装 、 运 行 、 结 果 分 析 等 。 


一 、 程 序 的 安装 
先 登 录 http://bioinf.cs.ucl.ac.uk/threader/ 网 站 下 载 相 应 的 文件 包括 程序 、 势 函数 文件 、 
折 和 登 库 文 件 等 。 并 且 通 过 电子 邮箱 注册 学 术 用 户 获得 license. 
下 载 后 程序 后 ， 按 照 下 列 步骤 在 本 地 机 器 上 安装 程序 。 | 
% cd /usr/people/yue 进入 上 自己 的 个 人 目录 
% mkdir threader 创建 threader 子 目录 
% cd threader 进入 threader ЁН Ж 
% gunzip potentials.dat.gz 解压 缩 势 函数 文件 
% gunzip < threader3-sgi.tar.gz | tar xfo - 安装 程序 
% mkdirtdb ПЕТРЕ Аж 
% cd tdb 进入 折 和 登 库 文 件 子 目录 
% gunzip < .tdb oct96.tar.gz | tar xfo - ВЕЖАЙ ЛЕУ 
% setenv THREAD DIR /usr/people/jones/threader 设置 环境 变量 
% vi $THREAD DIR/threader.lic 编辑 license 文件 《将 通过 邮箱 获得 
的 license 文件 精 贴 到 该 文件 中 ， 编 
辑 后 保存 ) 


二 、Threader 程序 的 运行 

шн 白质 是 1рр20, 1рр20 为 幽门 螺杆 菌 所 特有 的 一 种 脂 蛋 白 , 与 山门 螺杆 
菌 的 高 发 人 群 都 具有 密切 的 关系 ， 而 且 还 具有 良好 的 免疫 原 性 和 免疫 
保护 性 ， 因此 研究 该 蛋白 质 的 三 维 结 构 具 有 十 分 重要 的 意义 。 首 先 以 lpp20 的 氨基 酸 序列 
为 探 针 ， 用 Blas ТЕЖА ВЕ ІНЕН, SRE PDB 中 没有 发 现 与 
1рр20 具有 同 源 性 的 参考 和 蛋白， 因此 预测 1рр20 的 结构 不 能 采用 同 源 模 建 方法 。 

在 利用 Threader 分 析 蛋 白质 时 ， 多 种 序列 文件 格式 都 可 以 用 ， 但 最 好 是 PROWL Қ 
2. 下 面 是 本 研究 实例 中 所 用 蛋白 质 lpp20 的 序列 ， 共 有 175 个 氨基 酸 残 基 : 

MKNQVKKILGMSVVAAMVIN GCSHAPKSGISKSNKAYKEATKGAPDWVVGDLE 
KVAKYEKYSGVFLGRAEDLITNNDVDYSTNQATAKARA ANLKSTLQKDLENEKT 
RTVDASGKRSISGTDTEKISQLVDKELIAS (MLA YVGKDRVFVLVGLDKQIVDKVREE 

在 运行 程序 之 前 必须 确保 程序 的 license 文件 和 用 于 搜索 文库 的 蛋白 质 链 的 目录 文件 
在 当前 目录 下 ， 否 则 将 出 差错 。Threader 3.5 的 缺 省 license 文件 名 称 为 threader 于 
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搜索 文库 的 蛋白 质 链 的 目录 文件 在 缺 省 情况 下 用 psichain 161 表示 。 链 目录 文件 也 可 以 给 出 
另外 的 文件 名 ， 但 需要 在 运行 程序 时 说 明 。 

Threader 3.5 程序 的 控制 参数 以 命令 行 选项 来 表示 ， 大 部 分 参数 采用 缺 省 值 就 可 以 进 
行 搜索 。 运 行 Threader 3.5 最 简单 的 命令 行 是 : 

Threader lpp.seq Ірр -result,out 
这 将 使 jpp.seq 与 位 于 当前 目录 的 psichain.lst 文件 的 每 一 条 链 去 匹配 ， 并 将 结果 输入 
lpp-resultout 文件 。 程 序 的 作业 输出 可 以 通过 下 面 的 命令 直接 到 一 个 日 志文 件 中 : 

p.seq lpp -result.out > lpp.log 

加 入 -р 选项 将 输出 计算 产生 的 序列 联 配 : 

Threader -p lpp.seq lpp-result.out > lpp. log 
这 种 情况 下 ， 计 算 的 能 量 会 总 结 到 lpp-result.out F, 
日 志文 件 jpp.log 中 。 

如 果 将 了 改 为 -pm， 即 命令 为 : 
eader -pm lpp.seq lpp-result.out > lpp. Гор 

则 会 生成 适合 于 MODELLER 程序 输入 文件 的 联 配 格 式 , 这 样 如 果 能 够 找到 较为 适合 
的 折合 模式 ， 就 可 以 很 方便 地 搭建 出 目标 蛋白 的 三 维 结构 。 


联 配 《和 其 他 作业 文件 ) 将 送 到 


| т ЯТ, _Threader 程序 需要 运行 几 个 小 时 . 目标 序列 与 折 登 库 目 录 文 件 中 的 每 一 
hreader 之 后 得 到 结果 文件 ， 下 面 是 输出 文件 的 主要 格式 ; 
.01 —439.77 -0.20 6.55-1.52 100.05 -1.11 -1.11 -72.2 174 53.2 99.4 0 12asA0 
—537.63 0.26 2.05 -0.18 -22.51 0.05 0.05 -42.4 127 84.1 72.601rlhA0 
.33 —433.66 0.44 9.44 -2.38 115.28 —1.26 —1.26 —63.5 174 68.2 99.4 0 12са00 
10 —478.43 0,61 -3.60 1.50 —161.14 1.37 1.37 -132.6 168 76.0 96.0 0 12e8H0 
.32 —505.71 0.06 1.37 0.02 —22.54 0.05 0.05 -2.6 161 83.0 92.0 0 l4gsA0 
—301.81 —1.08 —4.58 1.79 -65.27 0.46 0.46 -29 144 89.5 82,9 0 1501B0 
5.96 —157.46 —2.54 3.80 —0.70 204.09 -2.10-2.10-14.1 155 83.8 88.6 0 153100 
96 —24.91 -0.43 1.59 -0.04 15.25 -0.31 -0.31-2.2 102 76.1 58.3 0 155c00 
—788.48 —0.56 0.99 0.14 12.25 —0.28—9.99—17.1 151 48.6 86.3 0 16урА0 
—110.11—525.51 0,93 —3.73 1.54 -185.82 1.60 1.60 9.6 144 84.2 82.3 0191400 
—78.61 -407.73 047 2.57 -0.33 -26.36 0.09 0.09 -67.4 173 59.2 98.9 0 19hcA0 
—57.53 -334.56 0.16 -1.59 0.90 —89.84 0.69 0.69 26 160 57.1 91.4 0 1а02М0 
63.68 -122.51-1.61 0.48 0.29 7344 -0.86-0.86-68,3 99 97.1 56.6 0 la02N1 
-91.15 -241,56 0.66 -1,60 0.91 —123.69 1.01 1.01 61.5 153 86.0 87.4 0 1a02N2 
-129.79-648.75 1,22 —1.06 0.75 -151.261.28 1.28 -21.6 168 82.0 96.0 0 1а04А0 
-168.04-514.73 1.78 -3.60 1,50 -241.23 2.13 2.13 15.4 134 97.1 76.6 0 1а04А2 
eader 程序 结果 文件 主要 有 14 列 ， 分 别 表示 不 同 的 参数 ， 每 列 代 表 的 参数 意义 


两 两 配对 的 能 量 之 和 ， 单 位 是 ;kcal/mol (1kcal- 


第 1 列 是 给 定 的 Threading KIYIK 
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4.184kJ)。 

第 2 列 给 出 的 是 模板 结构 的 天 然 能 量 〈 已 知 结构 与 其 自身 序列 的 能 量 ) ， 如 果 模 板 进 
行 threading 之 后 获得 模型 的 能 量 〈 第 1 列 ) 低 于 其 天 然 结 构 的 能 量 〈 第 2 列 ) ， 说 明 是 
一 个 错误 的 匹配 。 

第 3 列 是 两 两 配对 之 后 能 量 的 乙 分 值 (energy - mean) / standard_deviation)。 

第 4 列 为 原始 溶剂 化 能 量 之 和 。 


第 5 列 为 溶剂 化 能 量 的 2-28. 
第 6 列 为 经 过 标准 差 赋 权 重 之 后 得 到 的 两 两 比 对 及 溶剂 化 的 能 量 的 权重 加 和 。 
第 7 列 是 第 6 列 的 数值 的 Z- 分 值 。 


第 8 列 是 第 7 列 数值 的 Z- 分 值 , 其 中 如 果 模 型 与 很 少 的 结构 匹配 或 匹配 明显 错误 ， 则 
值 为 -9.99。 本 列 参 数 是 预测 结构 所 依据 的 最 重要 的 数据 。 

第 9 列 是 给 出 的 模型 的 序列 相似 性 分 数 〈 采 用 的 是 BLOSUM62 ТРЕТ ВРЕ У 
件 中 序列 的 profile 信息 ) 。 如 果 访 分数 很 高 ， 暗 示 目 标 结构 和 模板 结构 可 能 有 共同 祖先 。 

第 10 列 给 出 的 是 目标 序列 与 折 笃 库 中 每 一 条 折 盈 链 联 配 的 残 基 数量 。 有 时 候 经 常 需 
要 仔细 地 寻找 在 本 列 中 得 分 最 高 的 模型 。 

第 11 列 是 已 经 联 配 的 结构 的 百分数 。 

第 12 列 是 已 经 联 配 的 序列 的 百分数 。 

第 13 列 是 局 部 结构 域 匹配 的 起 始 位 置 。 对 于 大 多 数 正 常 的 搜索 ， 该 列 数 值 一 般 为 0。 

第 14 列 是 结构 在 PDB 数据 库 中 的 编码 加 上 对 应 的 链 与 结构 域 的 标识 符 。Threader 3 
使 用 的 结构 域 标识 符 方 案 与 UCL CATH 数据 库 中 的 匹配 。 新 的 标识 符 是 6 个 字符 ， 前 4 
个 字符 是 对 应 的 PDB 条 目 名 称 ， 第 5 个 字符 是 折 笃 模式 所 处 肘 链 的 编号 ， 第 6 个 字符 是 
对 应 的 结构 域 。 例 如 ，2tmdAl 指 的 是 PDB 数据 库 中 2TMD 条 目的 A 链 的 第 一 个 结构 域 。 
如 果 不 需 要 命名 结构 域 或 链 ( 即 只 有 一 个 结构 域 或 一 条 链 ), 则 缺 省 的 标识 符 为 0。 如 lmbd 
00 对 应 的 是 PDB 数据 库 中 的 IMBD 条 目 , 其 中 有 一 条 链 , 而 且 这 条 肘 链 没有 分 结构 域 ( 单 
结构 域 )。 

BÈ 14 个 参数 中 ， 对 于 结构 预测 结果 来 说 ， 最 有 意义 的 判 据 是 第 8 列 参 数 。 表 4-1 
是 第 8 列 参 数 的 不 同 分 值 代表 的 意义 。 


表 4-1 7-“ЕШЕУ 


ZAN E" 结果 说明 

2>40 ”很 有 意义 ， 极 有 可 能 是 正确 的 预测 

Z> 3.5 ”有 意义 ， 正 确 预测 的 机 会 较 大 

27<Z<3.5 处 于 有 意义 与 无 意义 的 边界 ， 可 能 是 正确 的 预测 

20<2<2.7 ”不 理想 的 分 值 ， 只 有 在 其 他 的 证 据 能 够 来 确认 的 情况 下 才 有 可 能 是 正确 的 
7,<2.0 0 ДЕНЕНІҢ, ERRER Р ИГЕ ТТ БН RO Rr kat k 
7, = -9.99 | ”与 模板 折 登 模式 的 序列 几乎 没有 联 配 的 可 能 


通常 可 以 利用 sort 命令 对 结果 文件 进行 分 类 整理 ， 比 如 ， 利 用 命令 “sort -n -r +7 
ipp.out” 可 将 结果 文件 按照 第 8 列 参 数 的 大 小 排序 ， 下 面 是 对 lpp20 的 Threader 结果 文件 
按照 第 8 列 参数 的 大 小 排序 前 10 МУР Ж. 

-278.51 —653.12 3.40 -6.89 2.48 -418.463.81 3.81 36.3 157 77.0 89.7 0 2uagA3 
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—252.03 —576.39 3.01 
—293.92 —285.43 3.63 
—290.57—710.86 3.58 
—267.75--468.81 3.24 
—287.93 —526.17 3.54 
-206.29--763.79 2.34 
-298.72 —465.72 3.70 
—235.84 —632.97 2.78 
—274.58 —655.14 3.34 


—7.93 2.79 
—4.69 1.83 
—3.87 1.58 
—4.60 1.80 
-3.55 1.49 
—7.38 2.62 
—2.70 1.24 
-3.70 2.13 
—3.70 1.53 


—413.12 3.76 
—389.24 3.54 
—369.15 3.35 
—361.24 3.27 
—360.06 3.26 
—356.03 3.22 
—353.63 3,20 
—351.64 3.18 
一 349.78 3.16 


3.76 


16.5 


3.54 51.2 


3.35 


3.27 


3.26 
3.22 


3.20 


3.18 
3.16 


16.5 
46.6 
20.0 
64.5 
81.2 
39.6 
-0.4 


162 73.0 92.6 0 lryp10 
130 94.9 74.9 0 lovqA0 
162 71.7 92.6 01438100 
134 85.9 76.6 0 leejAl 
139 91.4 79.4 0 lsquA0 
157 69.5 89.7 0 205А0 
132 86.8 75.4 0 ІҺутА0 
147 84,5 84.0 0 1р5а А0 
172 73.5 98.3 0 1е8сАЗ 


从 上 述 结果 来 看 ， 没 有 分 值 在 4 以 上 的 ， 也 就 是 说 没有 找到 有 显著 意义 的 折 又 模式 ， 


但 是 有 三 个 折 登 模式 的 分 值 大 于 3.5， 分 别 是 2uagA: 


~ пур10. lovqA0, 2 


义 的 结果 ， 说 明 pp20 ЖЕНГЕ ЕИ RhA, 


四 、 过 滤 假 阳性 结果 
Threader 预测 中 可 能 会 出 现 假 阳性 结果 ， 除 了 根据 生物 学 知识 过 滤 假 阳性 预测 之 外 ， 


这 也 是 比较 有 意 


hreader 本 身 也 提供 了 过 滤 假 阳性 结果 的 方法 ， 即 “ 洗 牌 ” 检验 (Shuffling Tests)。 在 序 


列 分 析 中 ， 经 党 采用 比较 一 个 真实 序列 和 一 个 随机 序列 的 匹配 分 数 ， 随 机 序列 一 般 与 真实 


的 序列 具有 相同 的 长 度 和 氨基 酸 组 成 。 通 种 的 情况 是 通过 对 原来 序列 进行 “ 洗 牌 ”来 得 到 


随机 序列 。 通 过 洗 牌 实验 计算 的 Z- 分 值 ， 就 可 以 识别 假 阳 


， 突 出 真 的 阳性 。 


在 本 节 中 ， 对 于 Threader 分 析 得 到 联合 Zz 分 值 大 于 2.7 的 结果 ( 共 27 个 结果 ) 进行 
了 洗 牌 检验 ， 洗 算 检验 可 以 通过 命令 来 实现 ，- 后 面 的 数字 表示 洗 牌 次 数 ， 如 果 洗 牌 50 


次 ， 可 以 


Н-г50 来 实现 ，Thre 
为 了 节省 计算 时 间 ， 洗 牌 


er-pm -r50 lpp.seq Ipp-resultr50.out > Ippr50. log 


时 可 以 只 对 有 可 能 的 折 又 模式 进行 重新 洗 牌 计算 。 


对 第 一 次 预测 结 采 中 Z 分 值 在 27 以 上 的 折 释 模式 进行 了 洗 牌 检验 ， 前 10 个 结果 


如 下 : 


-278.515 
-252.028 
—293.920 
-290.572 
-207.755 
-287.932 
-206.295 
-298.723 
-235.837 
-274.582 


-257.251 
-178.757 
-225.608 
-251.088 
-244.476 
-187.023 
-278.876 
-326.629 
-253.595 
-221.603 


2.89 
2.86 
3.56 
2.83 
2.58 
3.68 
1.07 
2.19 
1.91 
3.32 


—6.893 
—7.934 
—4.695 
—3.870 
—3.553 
—7.375 
—2.705 
—5.704 
—3.704 


-6.721 
-4,059 
-8.388 
-9.646 
-5.933 


-7.429 


-5.809 
-6.316 
-6.278 
-6.759 


1.81 
3.84 
1.61 
1.13 
1.38 
1.48 
0.95 
1.70 
1.23 


1.93 
1.70 
2.64 
2.21 


77.0 
73.0 
94.9 
71.7 


85.9 


91.4 
69.5 
86.8 
84.5 
73.5 


89.7 
92.6 
74.9 
92.6 
76.6 
79.4 
89.7 
75.4 
84.0 
98.3 


0 2uagA3 
0 lryp10 

0 lovqA0 
0 1а8100 
0 leejA1 

0 1squA0 
0 2tpsA0 

0 lbyrA0 
0 1g5qA0 
0 1e8cA3 


在 洗 牌 实验 结果 文件 中 ， 第 7 列 是 联合 洗 牌 Z- 分 值 (combined shuffled Z-score) ， 是 
结 末 中 最 重要 的 判断 参数 ， 从 洗 牌 检验 结果 来 看 ，1ryp10 极 有 可 能 是 1рр20 蛋白 对 应 的 折 
Ж. ЖА threader 预测 得 到 的 目标 序列 与 折 和 又 模式 序列 的 联 配 结果 ， 利 用 结构 措 建 程 
序 如 modeller， 就 可 以 搭建 出 该 蛋白 的 三 维 结构 ， 进 行 下 一 步 的 分 析 。 


第 五 章 


蛋白 质 分子 对 接 技术 


8-і ”和 蛋 白质 分 子 对 接 概述 


近 些 年 来 ,由 于 入 射线 晶体 结构 衍射 方法 及 NMR 方法 的 进步 ， 越 来 越 多 的 蛋白 质 和 
核酸 的 3D 结构 被 解析 出 来 。 在 很 多 情况 下 ， 蛋 白质 与 小 分 子 的 相互 作用 是 非常 重要 的 ， 
比如 很 多 酶 的 底 物 或 抑制 剂 都 是 小 分 子 ,一 些 重 要 重 白质 的 持 抗 剂 也 是 小 分 子 。 从 应 用 的 
角度 来 看 ， TEE Шыны RR 采用 基于 结 
构 的 药物 设计 《structure-based drug design, SBDD) 的 技术 来 开发 小 分 子 药物 (基于 结构 
的 药物 设计 是 一 种 利用 蛋白 质 结构 信息 来 开发 和 优化 小 分 子 抑制 剂 的 选 代 的 方法 )。 

获得 蛋白 肯 标 与 天 然 展 物 、 天 然 产 物 抑制 剂 、 从 文库 或 从 头 设计 的 支架 得 到 的 化 合 物 
的 空间 结构 , 就 可 以 精确 地 确定 关键 的 分 子 间 相 互 作用 。 通过 了 解 上 述 复合 物 的 三 维 结构 ， 
药物 化 学 家 和 分 子 模拟 专家 可 以 整理 出 对 分 子 进行 理性 修饰 的 策略 ， 以 提高 化 合 物 的 亲 和 
性 和 选择 性 ， 以 及 改善 化 合 物 的 药 代 动力 学 。 然 而 ， 生 物 大 分 子 与 其 底 物 的 复合 物 结构 趣 
很 难得 到 ， 这 就 使 得 对 生物 大 分 子 与 其 相应 底 物 的 结合 模式 的 预测 显得 尤为 重要 。 目 前 ， 
生物 大 分 子 与 其 底 物 的 结合 模式 的 确定 有 时 候 可 以 依靠 实验 手段 ， 比 如 光 偶 联 法 、 突 变法 
等 。 例 如 ，2008 年 ， 刘 明 等 人 依靠 此 方法 ， 成 功 地 测定 出 了 多 种 香 豆 素 (coumarin) 类 化 
合 物 与 HIV-1 整合 酶 (integrase, IN) 的 大 致 结合 模式 。 虽 然 实验 方法 能 够 比较 有 效 地 测定 
生物 大 分 子 与 相应 底 物 的 结合 模式 ， 但 是 由 于 其 耗 时 、 费 钱 ， 人 往往 令 许多 实力 较 弱 的 实验 
室 望 而 却步 。 此 外 ， 更 为 重要 的 是 ， 这 些 方 法 不 能 够 直接 反映 出 生物 大 分 子 与 其 底 物 的 具 
体 结合 模式 ， 而 只 能 给 出 一 个 较 模糊 的 信息 。 有 鉴于 此 ， шы ы) БИЕ НЕЙ 
TERN EWKA f. 1 ШЕТ [BJBJ3H ELEH RETRA. 正 是 这 样 一 和 

分 子 对 接 计算 是 把 配 体 分 子 放 在 受 体 活性 位 点 的 位 置 ， 然 后 按照 几何 互补 、 能 量 互 i 
以 及 化 学 环境 互补 的 原则 来 实时 评价 配 体 与 受 体 相 互 作 用 好 坏 ， 并 找到 两 个 分 子 之 间 最 佳 
的 结合 模式 。 分 子 对 接 是 从 整体 上 考虑 配 体 与 党 体 绪 合 的 获 休 ， 能 比较 好 地 避免 其 他 方法 
中 容易 出 现 的 局 部 作用 较 好 而 整体 结合 从 佳 的 情况 。 

分 子 对 接 在 药物 设计 中 具有 十 分 重要 的 意义 。 在 药物 分 子 产生 药 效 反 应 的 过 程 中 ， 药 
物 分 子 与 邯 酶 相互 结合 ， 首 先 就 需要 两 个 分 子 充分 接近 ， 有 来 取 合 适 的 取 同 ， 使 两 者 在 必要 
的 部 位 相互 契合 , 发 生 相互 作用 , 继而 通过 适当 的 构象 调整 , 得 到 一 个 稳定 的 复合 物 构象 。 
在 药物 设计 中 ， 分子 对 接 方 法 主要 用 来 从 小 分 子 数 据 库 中 搜寻 与 受 体 生物 大 分 子 有 较 好 亲 
和 力 的 小 分 子 ， 进 行 药 理 测 试 ， 从 中 发 现 新 的 先导 化 合 物 。 


第 二 节 ”利用 LibDock 进行 分 子 对 接 的 基 才 


DS LibDock 是 一 个 快速 的 分 子 对 接 工 具 ， 适 用 于 对 大 规 楼 


RETER SISI 


数据 库 进 行 快 速 精确 的 虚 
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拟 筛选 。LibDock 根据 小 分 子 构象 与 受 体 相互 作用 热 区 《hotspot) 匹配 的 原理 将 这 些 构象 
刚性 对 接 到 受 体 的 结合 口袋 当中 ， 其 最 大 的 优势 在 于 速度 快 ， 可 以 并 行 运 算 ， 适 合 于 进行 
大 规模 虚拟 筛选 ， 如 与 DS Catalyst Conformation 中 的 CAESAR 等 快速 生成 构象 的 方法 结 
合 使 用 更 佳 。 本 实例 中 ， 一 组 配 体 分 子 将 被 对 接 到 胸 并 激酶 (thymidine kinase) Ф. 


一 、 准 备 分 子 对 接 体 系 ， 执 行 分 子 对 接 计 算 
1. 定义 重 白 为 受 体 分 子 
在 Files 中 找到 文件 1kim.pdb， 鼠 标 双击 ， 该 蛋白 将 在 一 个 三 维 窗口 中 出 现 (图 5-1) 。 


Files X — Protocols | М "К ~ Wole cule Ti nm хі). = 
t 52 My Documents AE s Bg £a 
* Ld Desktop | > [| 
= W  5азр1ет р! Маън irSequance 
ж C] Customi оп. [к ж [z] ae 


hi E Scripts | к ||” ы әйгі Groupa 
= a as El 


E J Quick Start Tutorials 
mj єз Riciplor-Ligand Imntaraetisss 


图 5-1 打开 蛋白 质 三 维 结构 


点 击 选 择 下 拉 菜 单 Chemistry | Hydrogens | Add Polar 给 蛋白 添加 极 性 氧 。 

在 系统 视图 中 ， 展 开 <Cell>， 点 击 选 择 lkim。 然 后 在 Tools 中 从 下 拉 列 表 中 选择 
Receptor-Ligand Interactions, 打开 Receptor-Ligand Interactions 工具 面板 , 在 Define and Edit 
Binding Site 工具 面板 下 的 Define 工具 组 中 点 击 Define Selected Molecule as Receptor 将 前 面 
选择 的 蛋白 分 子 Ikim es E (图 5-2) 。 


ы] тен х егин. Su | п 
а = Кес крб азд Intar гасћіо 


一 一 一 一 一 š N Ts marcar ra ' 
тер кый ВАА Binding Site 02-24 
Fini ; 


辐 的 | SBD_Recaptor Define Selected Holeculs as Receptor 


efine Sphër4a Erom есіл 
Find Sites Erom Receptor Гатііге 


Find Sites as Valume of Selected Ligand | 


Edit ҒГізет i | 


图 5-2 ЖУН 
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2. 寻找 受 体 中 可 能 的 结合 部 位 
在 Define 工具 面板 中 点 击 Find Sites from Receptor Cavities 寻找 受 体 中 可 能 的 结合 部 


位 (EBI 5-3) 。 


-- j.—— 一 一 i rie te 
Tools X za ® 
q ср Se Interactions p- 
i 


Паф ыыы = 


Define Selected Molecule as Receptor 


mi un; p „Дыл papa: C iii | ‚м 


Define Sphere from Selection 


Find Sites from Receptor Cavities 


Find Sites as Volume of Selected Ligand 


ЛЫС 


Edit SI фас------------------------------------------------ 
Contract Pinding Sitas/Spheres 
! 
Expand Binding Sites/Spheres 


Delete Binding Sites Points 


Partition Sites... 


| Convert to Atoms 


图 5-3 从 受 体 中 寻找 结合 位 点 


在 系统 视图 中 展开 lkim， 可 以 看 到 识别 出 9 个 可 能 的 结合 位 点 ， 最 大 的 可 能 的 结合 
位 点 被 展示 在 图 形 视图 中 (图 5-4) 。 


"a= ü R... 


ikim = Molecule Window X 


a шб са 
= d- ikia 
[2] Д ProteinSequence 
W]e А 
“> Protein Groups 
а: Site 1 
[1 ә Site 2 
ГІ 42 Site 3 
ГІ ағ Site 4 
[] Site 5 
F] 2 Site 6 
F] ë: Site T 
ГІ! ШІ Site В 
[1 ë sz Site 9 


SBD 和 


[<] 


ша сз шаш алы mo mo сш m O mm um ишти вит тш піш emma ншы шыш mamam u mm н mamaman сеа 


图 54 Sai erl ЛАЙН 


3. 从 结合 位 点 定义 sphere Ж 
在 系统 视图 中 点 击 选择 Site 1, 点 击 View 工具 栏 中 的 Fit To Screen 按钮 放大 结合 位 点 ， 
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然后 点 击 Define and Edit Binding Site 工具 面板 下 Define 工具 组 中 的 Define Sphere from 
Selection， нінен акад ық са йй SBD Site Sphere (图 5-5) 。 


[rr р Te Т араараа pin =e Т СЛН FII == тү тс. — — —— -— ri 


Recaptor-Ligand Interactions 


Е ш % o мн | 和 = еріне 
| — 


Define 
Define Salected Molecule ar Racaptor 


Defina Sphere from Selection 


| Find Sites from Receptor Cavities 


=== аара e. 


Find Sites аз Valumaé sf 541есіай Li кап | 


Edit Sikas 


= m = 
--.. > = та ЗЕ АБЫ. .- “1 Їй 


Contract Pinding бійез/брһагав 
Ехраљі Pinding Sitasxs/Spharax 
Dèlate Dinding Sites Points 


Partition Sites. 


Er =" —= 


Convert іс Аіоах 


| al 


5-5 从 结合 位 所 定义 Sphere FR 


4. 修改 活性 部 位 球 半径 


在 系统 视图 中 ， 点 击 选择 SBD Site Sphere， 接 着 单 击 鼠 标 右键 选择 Attributes of 
SBD Site Sphere...， 打 开 SphereObjects Attributes 对 话 框 ， 在 对 话 框 中 找到 半径 (Radius) 
那 一 行 ， 将 值 设 置 为 9， 点 击 OK 按钮 (图 5-6) 。 


эрігетейіктесі Attributes 


5-6 SphereObjects Attributes 对 话 杠 


增 大 半径 的 目的 是 为 了 使 得 活性 部 位 的 大 多 数 点 被 包含 在 这 个 球 内 , 这 点 可 以 从 视图 
窗口 得 到 证 实 。 


在 系统 视图 中 通过 点 击 Site 1 前 面 的 框 将 Site 1 从 三 维 窗 口中 隐 去 ， 在 接着 的 对 接 中 
Site 1 不 会 被 用 到 。 
i CTRL+T 隐 去 窗口 中 的 数据 表格 (Data Table) 。 
5， 以 表格 浏览 器 形式 打开 配 体 文件 


在 文件 中 找到 配 体 文 件 kinase ligands.sd， 双 击 ， 配 体 文件 以 表格 浏览 形式 打开 
(H 5-7) . 
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6， 打 开 流 程 ， 修 改 参 数 
在 Protocols 中 展开 Receptor-Ligand Interactions 文件 夹 , 双击 Dock Ligands (LibDock) 
流程 ， 流 程 对 应 参数 在 参数 中 打开 СЕ 5-8) 。 


| Files | Protocols x | 
E4 = Receptor-Ligand Interactions ИИИ 

HO Апа1уте Li gand Foses 
S Calculate Binding Energies 
DO Consensus Score 
ӨМ De Hovo Evolution 
2/9 De Hovo Library Generation 
ПШ De Исто Link 
БӘ De Hovo Receptor 


H Dock Fragments MCSS) 
-8 Dock Ligands (CDDCKER) 
250 Dock Ligands (GOLD) 


ЖЕ Dock Ligands (LigandFit) 
ӨЗ Dock Ligands (Pharmacophore Restraints == 
GQ Flexible Docking 
加 Ligand Minimization 
АМ Score Ligand Foses 


5-8 打开 LibDock 对 接 流程 


在 参数 中 ， 点 击 Input Receptor 参数 ， 从 下 拉 列 表 中 选择 1kim:1kim 设置 受 体 蛋白 。 

At Input Ligands 参数 ， 从 下 拉 列 表 中 选择 kinase ligands:All， 指 定 对 接 配 体 。 

点 击 Input Site Sphere 参数 ， 从 下 拉 列 表 中 选择 sphere 的 坐标 。 

БАТ Docking Preferences 参数 ， 从 下 拉 列 表 中 选择 User Specified， 这 人 允许 你 为 对 接 计 
算 改变 特定 的 参数 。 

展开 Docking Preferences 人 参数， 点 击 Max Hits to Save 参数 ， 输 入 值 10 (图 5-9) 。 

7. 运行 分 子 对 接 计 算 ， 查 看 结果 

点 击 流程 工具 栏 (Protocols toolbar) 中 的 按钮 运行 作业 ， 等 待 作业 完成 。 

为 清晰 起 见 ， 从 菜单 栏 中 选择 Window | Close All 关闭 不 必要 的 窗口 。 待 作业 完成 后 ， 
双击 作业 中 刚 完 成 的 分 子 对 接 作 业 ， 打 开 Report.htm， 点 击 该 文件 中 Output 部 分 的 View 
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Results 链接 , 打开 对 接 计算 的 结果 。 打开 的 表格 中 显示 出 配 体 打 分 最 好 的 poses (图 5-10) 。 
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图 5-9 LibDock 对 接 参 数 设 置 
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8. 浏览 对 接 poses 

点 击 激活 Molecule-Molecule Window 窗口 ， 确 保 系统 视图 和 表格 浏 览 器 打开 ， 否则 接 
CTRL+H 和 CTRL+T 打开 。 按 CTRL 十 1 隐藏 流程 浏览 器 和 作业 浏览 器 。 然 后 在 系统 视图 
中 删除 Site 文件 及 binding site sphere， 以 便 观察 结果 。 
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点 击 表格 中 + 键 和 $ 键 将 配 体 在 图 形 窗口 中 显示 出 来 。 在 工具 栏 中 点 击 , 三 按钮 ， 
蛋白 结合 部 位 被 放大 。 

在 Tools 中 从 下 拉 列 表 中 选择 Receptor-Ligand Interactions， 打 开 Receptor-Ligand 
Interactions 工具 面板 ， 在 Visualize Receptor-ligand Interactions 工具 面板 下 扣 击 Receptor- 
Ligand Hydrogen Bonds (图 5-11) ， 在 视图 窗口 中 ， 受 体 原子 与 配 体 对 接 poses 间 的 氧 键 
会 通过 绿 线 显示 出 来 (图 5-12) 。 


| | 
Visualize Receptor-Li gand Interactions © ~ | 


| Define Selected Molecule as Receptor 


| Receptor-Ligand Bumps 
图 5-11 “显示 息 白 - 配 体 之 间 气 键 


为 了 更 好 地 观察 受 体 分 子 与 配 体 对 接 poses 间 的 相互 作用 ， 可 以 对 体系 进行 旋转 以 获 
得 最 佳 的 观赏 角度 。 在 表格 中 ， 点 击 + 键 和 $ 键 浏览 其 他 的 配 体 对 接 poses (图 5-12) 。 
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Р 5-12 浏览 对 接 结果 


二 、 分 析 对 接 结果 

{E Analyze Ligand Poses 流程 ， 计 算 对 接 构象 的 RMSD 值 ， 受 体 与 对 接 构 象 间 形 成 
的 氧 键 以 及 紧密 接触 〈 范 德 华 碰撞 ) 情况 。 

1. 打开 Analyze Ligand Poses 流程 ， 修 改 参 数 

按 CTRL+1, 显示 流程 (Protocols) 和 作业 (Jobs), 打开 Protocols 下 的 Receptor-Ligand 
Interactions 文件 夹 ， 双 击 Analyze Ligand Poses 流程 ， 相 应 的 参数 出 现在 参数 浏览 器 中 。 

点 击 Input Ligands 参数 格 ， 下 拉 列 表 中 选择 Molecule:All， 选 中 Molecule 窗口 中 所 有 
配 体 构 象 。 | 
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点 击 Input Receptor 参数 格 ， 从 下 拉 列 表 中 选择 Molecule:1kim。 

展开 Input Receptor 21, А: Hydrogen Bond 参数 格 ， 从 下 拉 列 表 中 选择 True. 

展开 Hydrogen Bond 参数 ， 设 置 Scope 参数 为 Residue 和 Molecule。 对 接 得 到 的 姿态 
与 整个 受 体 之 间 及 受 体 的 每 个 氨基 酸 残 基 形成 的 氧 键 数目 将 都 被 计算 出 来 。 

t Contacts 参数 格 ， 从 下 拉 列 表 中 选择 True. 

展开 Contacts 参数 ， 点 击 Туре 参数 ， 从 下 拉 列 表 中 选择 All。 这 一 缺 省 选项 计算 每 个 
对 接 poses 与 整个 受 体 及 每 个 对 接 poses 与 受 体 中 单个 氨基 酸 残 基 间 的 极 性 和 非 极 性 接触 。 
瓜 击 Scope 参数 格 ， u Residue (图 5-13) 。 
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图 5-13 “Analyze Ligand Poses” 流 程 参 数 设 定 


2， 运 行 流 程 和 查看 结果 

在 流程 工具 栏 中 ， 点 击 肝 按钮 开始 计算 。 当 作业 完成 时 跳出 作业 完成 对 话 框 ， 关 闭 
该 对 话 框 。 为 简洁 方便 起 见 ， 在 菜单 栏 中 选择 “Window | Close All” 关 闭 不 必要 的 窗口 。 

在 作业 浏览 器 中 ， 双 击 已 完成 的 作业 ， 在 DS 的 Htm 窗口 中 打开 Report.htm 文件 。 
在 Hml 窗口 中 “Output Files” 部 分 点 击 “View Results” 链 接 ， 分 析 计 算 的 结果 将 以 表格 
浏览 器 的 形式 打开 ， 其 中 有 些 列 中 包括 刚 计 算得 到 的 性 质 ; 

° 对 接 poses 与 整个 蛋白 形成 的 氨 键 数 

° 对接 poses 与 受 体 每 个 氨基 酸 残 基 形 成 的 氨 键 数 (304 列 ) 

° 对 接 poses 与 整个 蛋白 间 的 过 近 接 触 

е 对 接 poses 与 受 体 每 个 氨基 酸 残 基 间 的 过 近 接 触 (304 列 ) 

点 击 激活 Molecule-Molecule Window ЕП, Ж CTRL+1 隐藏 其 他 浏览 器 使 窗口 最 大 
显示 。 

3. Р= ЖАЛАК 

在 表格 中 , 点击 HBOND Count 1 1kim:A:MET46 列 头 选择 该 列 。 然 后 使 用 滚动 条 滚动 
到 HBOND Count FUR., F% SHIFT $, 点击 HBOND Count 304 Ikim:A:ALA375 列 头 ， 这 
将 选择 表格 中 所 有 包含 氢 键 数 的 栅 格 ， 其 中 每 一 列 对 应 一 个 氨基 酸 残 基 ， 每 一 行 对 应 一 个 
poses. 

在 菜单 栏 中 ， 选 择 Chart | Heat Map 产生 热 图 ， 热 图 中 的 热点 对 应 着 对 接 poses (了 轴 ) 
与 受 体 氨基 酸 残 基 (X Sh) 形成 的 氧 键 ， 比 如 可 以 从 图 中 看 到 Gln125 与 许多 对 接 poses JÉ 
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RAR (图 5-14) 。 

通过 手动 浏览 所 有 的 配 体 对 接 poses 来 识别 这 么 多 的 气 键 是 非常 具有 挑 成 性 的 。 热 图 
快速 显示 氨 键 图 谱 ， 用 于 洞察 那些 对 配 体 结 合 有 重要 贡献 的 氨基 酸 残 基 。 

移动 鼠标 指向 热 图 中 特定 的 栅 格 ， 浏 览 栅 格 对 应 的 信息 ， 如 残 基 名 称 、poses WAA 
键 数 等 。 
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图 5-14 И 


4. 产生 过 近 接触 数 热 图 | 

МЕНЕ Molecule-Molecule Window 窗口 。 在 表格 中 ， 点 击 Contacts 1 1kim:A:MET36 
列 头 选择 该 列 。 然 后 使 用 滚动 条 滚动 到 Contacts 列 末 ， 紧 按 SHIFT 键 ， 点 击 Contacts 304 
A:ALA375 列 头 ， 这 将 选择 表格 训 览 器 中 所 有 包含 过 近 接 触 数 的 栅 格 ， 同 前 面 一 样 ， 其 中 
每 一 列 对 应 一 个 氨基 酸 残 基 ， 每 一 行 对 应 一 个 poses. 

在 菜单 栏 中 ， 选 择 Chart | Heat Мар 产生 热 图 ， 热 图 中 的 热点 对 应 看 对 接 poses (YHD 
与 受 体 氨基 酸 残 基 (X qH) 之 间 的 过 近 接 触 数目 。 移 动 鼠 标 到 热 图 中 的 热点 ， 可 以 看 到 某 
个 poses 的 过 近 接 触 数目 , 垂直 条 纹 表明 某 个 残 基 与 对 接 poses 间 的 过 近 接触 情况 (图 5$-15)。 


图 5-15 过 近 接 触 数 热 图 
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5. 在 图 形 窗口 浏览 过 近 接 触 
点 击 激 活 Molecule-Molecule 窗口 。 
点 击 表格 中 Ф 键 和 $ 键 将 配 体 在 图 形 
窗口 中 显示 出 来 。Tools 中 Receptor- 
Ligand Interactions 工具 面板 下 ， 在 
Visualize Receptor-ligand Interactions 工具 
面板 下 点 击 Receptor-ligand Bumps, 在 视 _ 
图 窗口 中 ， 受 体 原 子 与 配 体 对 接 poses [н] 
的 气 键 会 通过 楷 色 线 显 示 出 来 (图 5-16)。 
操 击 表 格 中 的 其 他 栅 格 显示 被 选 
. 5-16 ”过 近 接 触 示意 图 poses 与 受 体 原子 之 间 的 过 近 接 触 。 本 实 
例 中 不 是 所 有 poses 都 会 有 过 近 接 触 


存在 。 
BW 利用 Flexible Docking 进行 受 体 和 配 体 柔性 的 分 子 对 接 实 例 


前 面 介绍 的 LigandFit 是 一 个 刚性 的 对 接 工具 ， 除 了 LigandFit 外 ， 操 作 系 统 还 提供 
了 一 个 受 体 柔 性 的 对 接 工 具 , DS Flexible Docking 就 是 一 个 受 体 柔 性 对 接 工具 (Induced-Fit 
对 接 工具 ) ， 可 以 实现 配 体 - 受 体 双 柔性 对 接 ， 模 拟 配 体 与 受 体 结合 时 的 诱导 -契合 效应 
(induced-fit) , Flexible Docking 模块 先 对 和 蛋白 活性 口袋 的 侧 链 产生 多 个 构象 ， 然 后 将 配 体 
对 接 到 受 体 的 活性 口袋 当中 ， 最 后 对 得 到 的 配 体 - 受 体 复合 物 结构 进行 优化 。Flexible 
Docking 最 大 的 优势 在 于 准确 ， 可 以 精细 地 研究 配 体 - 受 体 的 相互 作用 信息 ， 适 合 于 作用 机 
理 研究 。 需 要 DS CHARMm、DS LibDock、DS Catalyst Conformation、DS Protein Refine 
模块 支持 。 

在 Flexible Docking 中 ， 配 体 将 按 如 下 步骤 对 接 到 活性 部 位 氨基 酸 残 基 有 和 柔性 侧 链 的 
受 体 中 : ОА ЕНЕ ӘНЕ, 使 用 CHARMm 通过 改变 侧 链 构象 计算 出 一 组 结构 ; 
DEH LibDock 将 柔性 配 体 对 接 到 每 一 个 受 体 构象 的 活性 部 位 ; 外 使 用 ChiRotor 
(CHARMm) 在 刚性 配 体 存在 的 情况 下 优化 选 定 的 蛋 日 侧 链 : 出 使 用 CDOCKER 优化 最 后 
的 配 体 。 

在 本 实例 中 ， 你 将 完成 一 个 晶体 重 构 实 验 ， 将 来 自 PDB ID 为 3ert 中 的 配 体 重新 对 接 
到 受 体 结构 中 。 


一 、 准 备 对 接 的 分 子 体 系 ， 完 成 分 子 对 接 计 算 

I. 在 DS 窗口 中 打开 蛋白 和 配 体 文件 

在 DS 文件 浏览 器 中 ， 和 寻找 恒 白 数 据 文件 lerr protdsv， 双 击 ， 和 蛋白 将 在 一 个 新 的 三 
维 窗口 中 打开 。 接 着 找到 配 体 数 据 文件 3ert ligand.sd， 将 其 抑 搜 到 受 体 蛋 白 所 在 的 三 维 窗 
口 。 此 和 绰 日 文件 已 经 过 前 处 理 ， 定 义 好 结合 位 点 Sphere， 并 且 定 义 了 配 体 5A 范围 内 的 氮 
基 酸 残 基 为 一 个 group， 命 名 为 ler res1， 作 为 柔性 对 接 的 毛 基 酸 残 基 (图 5-17) 。 
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图 5-17 ПЛЕНЖІЧЕУІН 


2， 对 受 体 及 配 体 分 子 赋 力 场 参数 = т 
在 工具 ( Tools ) 中 和 从 下 拉 列 表 中 选择 | йі су l ныт таа 4 Е 
Receptor-Ligand Interactions ,打开 Receptor- Simulate Strastures 030050 


Ligand Interactions 工具 栏 。 在 Simulate Structures| "еее | 
Forcefield 工具 栏 中 从 下 拉 列 表 中 选择 CHARMm， еее” | 
点 击 Apply Forcefield， 给 受 体 及 小 分 子 配 体 赋 力 | 4 
场 。 配 体 赋 好 力 场 后 ，Tools 中 其 力 场 状态 将 显示 
为 : lerr prot typed with CHARMm (Ё 5-18) 。 
3. 打开 和 柔性 对 接 流程 ， 修 改 参 数 lerr prot typed with CNKAENa 
在 Protocol 中 展开 Receptor-Ligand Interactions | ,,, 
文件 夹 ， 双 击 Flexible Docking 流程 ， 打 开 和 柔性 对 
接 流 程 ， 该 流程 的 参数 项 在 参数 中 出 现 。 在 参数 5-18 赋予 力 场 参数 
中 点 击 Input Typed Protein Molecule 参数 ， 然 后 从 下 拉 菜 单 中 选择 lerr_prot:lerr_prot. 
点 击 Input Ligands， 从 下 拉 菜 单 中 选择 lerr_prot'All。 
点 击 Input Site Sphere 参数 格 ， 从 下 拉 菜 单 中 选择 Sphere 坐标 。 | 
Aiit Selected Residues 参数 格 ， 从 下 拉 菜 单 中 选择 lerr res1。 这 一 操作 将 选择 活性 部 
位 的 一 组 氨基 酸 残 基 ， 这 些 氨 基 酸 残 基 已 经 预先 被 选 上 且 定 义 为 lerr_resl 组 。 
展开 Generate Protein Conformations 参数 组 ， 点 击 Maximum Number， 输 入 数值 2。 
展开 Generate Ligand Conformations 参数 组 ， 点 击 Conformation Method 2, M РУ 
菜单 中 选择 best 方法 。 
展开 Docking 参数 组 ， 点 击 参数 Max Hits to Save 设置 为 3 (M 5-19) . · 
4. 分 子 对 接 计 算 和 结果 浏览 
在 流程 工具 栏 ， 点 击 运行 按钮 种 ， 等 待 作业 完成 。 当 作业 完成 时 会 出 现 作业 完成 对 
话 框 ， 关 闭 作业 完成 对 话 框 。 


Clear Forcefield 
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48 | 蛋白 质 结构 预测 实验 指南 


Flexibla кез x | 
те» 5-а 


ШЕ: ЫЕ какаш. л 


 dnput Ligandx 
Input 514е Sphëara 
| Selected Residues 


Нахташв Conformati ons 


MWumbear of Hotspots 
на A 
Tolerance 
ш Preferences 
[ REET Filter 
|Æ Docking Befinemen t 
Іш Міғапсей Settings 
а Parallel Frocessing 


G Generate Protein Contformati ont 


Discard Existing Conformaetsss 


68.0268, 34 1182, 74.5856, 9 
[агт гез 


Trua 


图 5-19 Flexible Docking 参数 设置 
在 开始 结果 浏览 之 前 ， 为 了 简洁 起 见 ， 在 菜单 中 选择 Window | Close АП 关闭 所 有 


窗口 。 


在 作业 中 ， 双 击 刚 完成 的 作业 ， 这 会 在 Html 窗口 中 打开 Report.htm 文件 。 在 Html @ 
口中 的 输出 文件 (Output Files) 部 分 ， 点 击 View Results 链接 ， 打 开 对 接 结 果 。 


5. 浏览 配 体 对 接 姿 态 


点 击 标签 激活 结果 窗口 ， 为 便于 浏览 ， 按 CTRL+1 隐藏 流程 浏览 器 和 作业 浏览 器 。 
按 CTRL+H 打开 系统 视图 (Hierarchy View) 。 
在 系统 视图 中 ， 勾 选 SBD Receptor， 重 白 所 有 和 氨基酸 残 基 都 显示 出 来 。 


图 5-20 对接 结 果 示 意图 


然后 点 击 表格 中 Ф A % 键 浏览 
对 接 的 配 体 构象 ， 随 着 鼠标 点 击 表格 中 的 
不 同 配 体 对 接 姿态 ， 视 图 窗口 中 的 配 体 对 
接 姿 态 会 随 之 更 新 。 

在 Tools 中 从 下 拉 列 表 中 选择 
Receptor-Ligand Interactions ， 打 开 
Receptor-Ligand Interactions 工具 面板 ， 在 
Visualize Receptor-ligand Interactions 工具 
面板 下 点 击 Receptor- ligand Hydrogen 
Bonds， 在 视图 窗口 中 ， 受 体 原子 与 配 体 
对 接 poses 间 的 氧 键 会 通过 绿 线 显示 出 来 
(图 5-20) 。 


在 表格 中 ， 继 续 点 击 剩 下 的 配 体 对 接 资 态 ， 这 样 对 接 姿 态 将 被 添加 到 系统 视图 中 去 并 
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逐一 在 图 形 视图 中 显示 出 来 ， 前 面 Selected Residues 参数 识别 出 的 氨基 酸 残 基 侧 链 构象 将 
随 着 配 体 姿 态 变化 而 变化 。 

在 Visualize Receptor-ligand Interactions 工具 面板 下 再 次 点 击 Receptor-ligand Hydrogen 
Bonds， 在 视图 窗口 中 ， 受 体 原 子 与 配 体 对 接 poses 间 的 氢 键 会 取消 显示 。 

从 菜单 中 选择 Window | Close All， 关 闭 所 有 窗口 。 


二 、 分 析 配 体 对 接 结果 

下 面 我 们 计算 配 体 对 接 构 象 的 RMSD 值 及 分 析 其 CDOCKER ВЕЕ, 

1. 在 DS 窗口 中 打开 3ert 配 体 的 晶体 构象 

J CTRL+1 使 Discovery Studio 浏览 器 恢复 通常 状态 。 在 文件 中 找到 3ert ligand.sd， 
右键 点 击 ， 选 择 Open With | 3D Window, 3ert 配 体 的 晶体 构象 将 在 一 个 新 的 三 维 窗口 中 打 
开 (图 5-21 ) РЯ 


PE л а от 
在 文件 中 ,打开 和 柔性 对 接 作业 输出 文件 夹 , 将 lerr protsd 拖 搜 到 配 体 晶 体 构象 所 在 的 
三维 窗口 ， 这 会 在 同一 个 三 维 窗口 打开 所 有 的 对 接 姿 态 (图 5.20). 


图 5-21 3ert 配 体 晶 体 构象 图 522 КОЖЕ БАН ЕЗ 


3， 将 晶体 构象 定义 为 结构 比较 的 参考 构象 

在 系统 视图 中 ， 点 击 第 一 个 配 体 构象 Gert ligand) 选择 它 ， 这 个 构象 即 对 应 晶体 构 
象 。 从 菜单 中 选择 Structure | RMSD | Set Reference， 将 3ert 晶体 构象 设置 为 RMSD 计算 的 
参考 构象 。 

4， 计 算 对 接 产 生 的 姿态 与 晶体 资 态 的 差异 

在 菜单 中 选择 Structure | RMSD | Heavy Atoms， 计 算 对 接 产 生 的 姿态 与 晶体 姿态 的 差 
异 ，RMSD 值 将 在 新 的 窗口 中 出 现 (图 5-23) 。 


白质 结 ЛЕП ШЕШЕН. 


Неауу Atom RMSD to 3ert_1igand 1 


Name 

Зеге, 11дапа 1 
Зеге 1ідапа 2 
3ert_ligand 3 
зеге 11дапа 4 
Зеге _11дапа 5 


3ert_ligand 6 


Reference 

зегі. 11дапа4 1 
3 了 ert_119and 1 
3ert_11gand 1 
3ert_l1igand 1 
3ert_iigand 1 
3ert_l1igand 1 


RMSD (A) 
0.00 


图 5-23 ВАЧМЕН ЖАРЫН RMS 


Chspyautodockscippsedy) ЭРЭН. ЖАРИ ИЯ АЕ ПАНЕ ЕЛНЫ 


' 子 对 接 软件 ， 采 用 拉 马 克 遗 传 算法 。AutoDo 主要 用 于 小 分 了 与 其 受 体 的 对 接 ， man 


zz 体 只 能 是 蛋白 ， о ны ы А ыы 
+ ЛЛА ТЯН (С. H. O. N. S 等 )， 但 是 在 AutoDock Ф, ШИЖ. 
元 Ж, 大 大 用 范围 。 以 下 将 分 别 就 AutoDock4 的 安 


一 、AutoDoek 的 安装 
AutoDock 的 安装 比较 简单 ， 主要 分 为 两 个 步骤 ， 即 AutoDock 程序 包 的 安装 和 


大 多 数 计算 化 学 研究 员 的 工作 平台 都 是 Linux， 因 此 只 就 
装 进行 说 明 ， 如 果 读 者 想 在 其 他 平台 下 运行 AutoDock， 请 


кы 
1. 在 Linux 下 安装 Auto к HITA 


后 从 该 网 页 上 部 的 链接 进入 到 AutoDock 的 下 载 页 面 。 在 这 里 需要 注意 的 一 点 是 ， FË 
AutoDock 之 前 需要 先进 行 信息 注册 ， 注 册 完 后 才能 下 载 。AutoDock 支持 多 种 操作 系统 ， 
读者 可 以 根据 自己 需要 进行 下 载 。 另 外 需要 提 到 的 一 点 是 ， 在 AutoDock 及 其 他 工具 的 下 
载 页 面 中 ， 除 了 Ашороск 程序 本 身 ， 还 有 一 个 Ашороск Tools (ADT)。 顾 名 思 义 ， 这 个 
ADT 相当 于 一 个 Ашороск 的 接口 软件 。 利 用 该 软件 ， 能 够 在 图 形 用 户 界面 的 环境 中 对 欲 
分 析 的 体系 进行 各 种 操作 ， 包 括 从 受 体 文件 、 配 体 文件 的 准备 到 AutoDock 的 运行 ， 再 到 
最 后 的 结果 分 析 。 

对 于 之 前 使 用 过 AutoDock 的 读者 来 说 ， 可 能 已 经 很 熟悉 AutoDock В 
但 是 对 于 从 未 接触 过 AutoDock 的 读者 来 说 , 在 此 有 必要 对 刚刚 下 载 的 Аш | Ж 
一 简要 说 明 。 读 者 下 载 的 AutoDock 文件 包 一 般 由 两 个 文件 组 成 ， 一 个 是 Азоб, m 
个 是 AutoGrid。 AutoGrid 负责 进行 分 子 对 接 之 前 的 格 点 能 计算 (具体 理论 请 参考 AutoDock 
User Guide 3)， 而 AutoDock 负责 分 子 对 接 和 结合 自由 能 计算 等 任务 。 当 获得 了 AutoDock 
文件 包 后 ， 读 者 可 以 按照 以 下 步骤 来 安装 Ашороск 文件 包 , 

° 在 linux 系统 下 新 建 一 个 文件 夹 用 来 存放 Ашороск 文件 包 为 方便 起 


2 见 ， 作 者 假 
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设 读者 把 该 文件 夹 命 名 为 AutoDock4 ) 

mkdir AutoDock4 

“ 将 下 载 AutoDock 文件 包 移 动 至 刚刚 建立 的 文件 夹 内 ,并 且 进 入 该 文件 夹 

ту autodocksuite-4.2.1-i86Linux2.tar.gz / AutoDock4 

cd AutoDock4 

е 提取 文件 包 中 的 文件 ， 得 到 AutoDock 和 AutoGrid 

tar xvzf autodocksuite-4.2.1-i86Linux2.tar.gz 

е 为 上 一 步 提取 的 AutoDock 和 AutoGrid 添加 可 执行 权限 

chmod u+x autogrid4 autodock4 
””。 做 环境 变量 影射 

`> vi.bashe 如果 读者 用 的 不 是 bsah shell， 请 咨询 电脑 管理 员 ) 

在 打开 的 vi 编辑 器 中 添加 类 似 的 环境 变量 

export PATH=$PATH:/home/USERNAME/AUTODOCK4 FOLDER 

其 中 USERNAME 和 AUTODOCK4 FOLDER 分 别 为 用 户 自 己 的 主 目 录 名 和 
Autodock4 所 在 的 文件 夹 。 

2， 在 Linux FEX AutoDock Tools 

AutoDock Tools (ADT) 是 Scripps 研究 所 开发 的 一 个 集 AutoGrid、AutoDock 的 输 
入 文件 的 准备 和 结果 分 析 等 功能 于 一 身 的 软件 。 利 用 该 软件 ，AutoDock 用 户 可 以 轻松 地 
在 图 形 用 户 界 面 下 进行 各 种 操作 。 当 然 ， 对 于 已 经 很 熟悉 AutoDock3 的 用 户 ， 也 可 以 使 用 
python 脚本 进行 操作 。 关 于 该 软件 的 使 用 ， 将 在 本 章 后 面 的 部 分 进行 介绍 。 

АРТ 的 下 载 不 需要 注册 ,可 直接 从 http://mgltools.scripps.edu/downloads FR, EFE 
时 请 尽量 使 用 FlashGet 等 可 以 断 点 续 传 的 下 载 工 具 ， 因 为 ADT 的 下 载 对 于 教育 网 的 用 户 
来 说 依然 是 绥 慢 的 ‘笔者 就 曾 在 论坛 上 见 过 有 人 求助 此 问题 )。 目 前 АРТ 的 最 新 版 本 是 
1.54, 在 下 载 页 中 ， 访 者 可 以 根据 自己 的 需要 下 载 不 同 版 本 。ADT 在 Windows 平台 下 的 
安装 很 简单 , 在 此 只 叙述 ADT 在 Linux 平台 下 的 安装 方法 。 关 于 ADT 在 Windows 和 Mac 
平台 下 的 安装 , 读者 参考 下 在 页 面 上 相应 的 安装 指导 。 以 下 叙述 ADT 用 安装 文件 在 Linux 
平台 下 安装 ADT: 

* 将 下 载 的 ADT 安装 文件 (mm 格式 ) 利用 FTP 工具 《如 CuteFTP) 传输 到 Linux 
平台 下 

° 新 建文 件 夹 ADT， 并 将 ADT 安装 文件 移动 到 该 文件 夹 内 

mkdir АРТ 


mv ADT install fille /ADT 
° 给 ADT 安装 文件 添加 执行 权限 
chmod utx ADT install file 
е 运行 ADT 安装 文件 
| ЖЕ panpe ec. кын АРТ 
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。 执行 pm 安装 包 并 根据 提示 ， 将 ADT 安装 到 目标 文件 夹 


—. AutoDock 的 基本 应 用 
上 一 节 和 叙述 了 AutoDock4 在 Linux 平台 下 的 安装 过 程 。 以 下 将 分 三 个 部 分 同 读 者 比较 
系统 地 讲述 Ашороск 的 基本 应 用 。 在 完成 本 节 的 学 习 后 , 读者 将 能 够 掌握 AutoDock 的 最 


基本 应 用 。 
1. Ашороск 的 操作 流程 


AutoDock 的 操作 流程 如 图 5.24 所 示 ， 可 以 分 为 4 个 


| 步骤 ， 在 这 4 个 步骤 中 ， 第 一 个 步 又 万 为 重要 ， 因 为 输入 


文件 的 正确 与 否 直接 关系 到 下 面 步骤 运算 结果 的 准确 性 。 


2， 用 AutoDock Tools 操作 Ашороск 进行 分 子 对 接 
j ADT 是 一 个 可 视 化 的 分 子 模拟 软件 包 , 它 集成 了 分 子 


显示 、 作 图 、AutoDock 输入 文件 的 准备 、 结果 分 析 等 功能 。 


Г 在 这 一 节 中 , 将 以 HIV-1 蛋白 酶 (protease) 及 其 抑制 剂 为 . 


( 例 向 读者 介绍 用 ADT 生成 PDBQT 的 方法 ， 而 其 分 析 功 能 
将 放 在 本 章 的 最 后 加 以 叙述 。 至 于 其 他 在 对 接 中 较 少 涉及 
| ”的 功能 , 请 有 兴趣 的 读者 参考 AutoDock 网 站 上 的 资源 。 此 
图 5-24 Ашороск 的 操作 流程 ”外 ， 由 于 ADT 的 流行 仅仅 是 最 近 一 两 年 的 事情 ， 因 此 该 软 
件 在 设计 上 还 存在 着 一 些 不 足 , 最 令 人 费解 的 地 方 就 是 在 生成 PDBQT 时 多 种 多 样 的 组 合 。 
设计 者 最 初 的 目的 可 能 是 为 了 满足 不 同 用 户 的 多 种 多 样 的 需求 。 毕 竟 在 一 次 模拟 过 程 中 得 
到 一 个 输出 文件 很 可 能 就 是 其 他 模拟 过 程 的 输入 文件 ， 因 此 АРТ 有 必要 考虑 到 多 种 情况 
以 便 尽 可 能 地 满足 用 户 的 需要 。 从 这 一 点 上 来 说 ，ADT 可 谓 是 一 个 非常 灵活 的 软件 ， 这 一 
点 是 其 他 商业 软件 所 无 法 比拟 的 。 由 于 篇 幅 的 原因 ， 无 法 对 每 一 种 生成 PDBQT 的 办 法 一 
一 进行 说 明 ， 还 请 读者 见谅 。 

(1) 准备 配 体 文件 和 受 体 文件 ”用 AutoDock 进行 分 子 对 接 的 第 一 步 是 为 AutoGrid 和 
Ашороск 准备 其 必须 的 配 体 和 受 体 文件 。 在 AutoDock4 中 ， 其 配 体 、 受 体 的 输入 文件 格 
式 为 PDBQT。PDB 文件 大 家 应 该 已 经 很 了 解 了 ， 实 际 上 其 主体 就 是 原子 坐标 。 而 РОВОТ 
文件 不 仅 包含 了 原子 坐标 ， 而 且 还 包含 了 原子 类 型 、 部 分 电荷 (partial charges) 其 全 以 及 
柔性 键 等 信息 。 

对 于 一 个 典型 的 分 子 对 接 运算 〈 指 在 对 接 过 程 中 考虑 配 体 的 部 分 或 全 部 柔性 ， 而 受 体 
保持 刚性 )， 一 般 需 要 准备 两 个 PDBQT 文件 , 一 个 包含 配 体 的 信息 ， 另 一 个 包含 受 体 的 信 
息 。 生 成 一 个 PDBQT 文件 的 过 程 比较 复杂 ， 一 般 可 分 为 以 下 5 Ж; 

ө 为 输入 的 配 体 / 受 体 补 全 百 原 子 (all-atom model) 

. 为 所 有 原子 添加 部 分 电荷 

о 删除 非 极 性 H 原子 ， 并 把 其 部 分 电荷 添加 到 其 母 原子 (mother atom) 上 

о 确定 原子 类 型 , 包括 定义 氧 键 受 体 (acceptory/ 供 体 (donor)、 定 义 芳 环 矶 、 脂 肪 族 碟 原 
子 等 操作 

. 定义 根 原子 (root atom) 并 确定 柔性 键 

在 此 需要 说 明 的 一 点 是 ， 读 者 也 可 以 在 最 初 为 配 体 / 受 体 加 H 原子 时 直接 选择 添加 极 
性 H 原子 ， 然 后 再 添加 电荷 ， 这 样 上 述 前 3 个 步骤 可 以 简化 为 2 个 步骤 , 但 要 注意 ， 此 时 
不 能 再 用 Autodock Tools 为 分 子 添加 Gasteiger 电荷 ， 因 为 Gasteiger 电荷 的 计算 是 基于 全 
原子 模型 (all-atom model) 的 。 生 成 PDBQT 文件 的 方法 如 下 。 
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D 配 体 文件 的 准备 

а. 获得 配 体 文件 一 般 来 说 ， 获 得 配 体 文件 有 两 种 途径 ， 一 种 是 从 网 上 数据 库 (如 
ZINC) 下 载 ， 另 一 种 是 利用 ChemDraw 或 Chem3D 等 软件 自己 构建 。 

b. 读 入 配 体 文件 ”启动 ADT， 菜 单 栏 File | Read Molecule， 在 弹出 的 Read Molecule 
对 话 框 中 选择 配 体 文件 ligan 1TCX.pdb， 单 击 OK 读 入 配 体 文件 。 由 于 ADT 不 能 识别 中 
文字 符 , 因此 不 要 把 任何 要 用 ADT 处 理 的 文件 放 到 含有 中 文 的 文件 夹 或 路 径 中 (图 5-25). 
此 外 ，ADT 支持 抑 搜 读 取 ， 当 文件 路 径 过 深 时 ， 读 者 可 利用 ADT 的 此 特点 来 快速 读 取 
数据 。 
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5-25 配 体 文件 的 读 入 


c， 配 体 加 了 (al-atom model) 读 入 配 体 文件 后 ， 菜 单 栏 Edit | Hydrogens | Add， 在 弹 
出 的 Add Hydrogens 对 话 框 中 选择 All Hydrogens、noBondOrders、yes。 可 选择 性 保存 加 过 
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Н 的 配 体 文件 ，File | бауе | PDB (图 5-26). 
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setup ligans_allH_01TCX: 

added gasteiger charges 
merged 38 non-polar hydrogens 
found 15 aromatic carbons 


detected 17 rotatable bonds 
set TORSDOF to 15 


图 5-26 КОЛЖ 
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d. 生成 配 体 的 PDBQT 文件 “” 单 击 工具 栏 上 的 Ашороск Tools 标志 ® iih 
AutoDock 菜单 (图 5-27), 在 AutoDock 菜单 上 选择 Ligand | Input | Choose。 在 弹出 的 Choose 
Molecule for AutoDock 面板 上 选择 上 一 步 中 加 过 HH 的 HIV-1 整合 酶 抑制 剂 为 配 体 分 子 。 单 
击 Select Molecule for AutoDock 后 大 约 ls 取决 于 电脑 速度 ) 会 弹出 一 个 Summary for 
ligand filename 〈 配 体 文件 名 ) 的 对 话 框 (图 5-28)。 从 这 个 对 话 框 中 显示 的 信息 可 以 看 
出 ， 实 际 上 这 一 步骤 是 一 个 集成 了 4 步 运 算 的 复合 运算 ， 即 ; 
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| Select Molecule for AutoDock4 | 


Dismiss 
Choose Molecule for AutoDock4 В 
5-27 


。 首 先 ，ADT 检测 输入 的 分 子 是 否 存在 电荷 信 ЕЕ 
息 ， 如 果 有 则 保留 ,如 果 没 有 则 计算 Gasteiger 电荷 并 | | 
赋予 之 。 这 里 需要 注意 的 一 点 是 ， 计算 Gasteiger 电荷 А кезеннен charges 


merged 38 non-polar hydrogens 


需要 用 到 全 原子 模型 ， 因此 要 想得到 正确 Gasteiger 电 | found 15 aromatic carbons 
荷 ， 必 须 保 证 输入 的 配 体 分 子 上 所 有 的 了 原子 都 已 经 |。 Он 
。 其 次 ，ADT 删除 所 有 非 极 性 原子 ， 并 将 其 | x 


电荷 分 配 到 其 相应 的 母 原子 上 此 步 又 可 以 通过 设置 | 
File | Preferences | Modify Default | AutoDockTools | 
Automerge NPHS =0 来 屏蔽 掉 )。 

。 再 次 ，ADT 为 每 一 个 原子 分 配 一 个 AutoDock 中 定义 的 原子 类 型 。A 代表 芳香 C 
原子 ，NA、OA、SA 分 别 代表 可 作为 氧 键 受 体 的 N、O 和 S$ 原子 ，HD 代表 作为 气 键 供 体 
的 H 原子 。 关 于 具体 的 原子 类 型 定义 及 原子 类 型 分 配 规则 ， 有 兴趣 的 读者 可 以 参考 
AutoDock 网 站 上 的 相关 资源 (如 AutoDock 手册 等 )。 除 了 可 以 让 ADT 自动 分 配 原子 类 型 
以 外 ， 读 者 也 可 以 利用 Ligand | Aromatic Carbons 来 自 定 义 芳 环 C 原子 。 

е 最 后 ，ADT 检测 输入 的 配 体 分 子 的 柔性 并 设置 二 面 角 自由 度 (TORSDOF， 实 际 上 
就 是 配 体 上 柔性 键 的 数目 )。 


5-28 
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е. 设置 根 原子 (rooftj 用 Ligand | Torsion Tree | Detect Root 让 程序 自动 确定 root, im 
5-29 所 示 ，root Е 3D E 


тш ; talat 0 барас т=н Calor Сала Нрікіцеп Белін Gridi Halp | 


Бы? Ç ES CLR RE 


Жәй: Жиен Тола: 0 Selected: 229 
图 5-29 选择 Root 


f， 手 动 选择 柔性 键 〈choose іогѕіопѕ) 用 Ligand | Torsion Tree | Choose Torsions 手动 
选择 柔性 键 。 如 图 5-30 所 示 ， 绿 色 代 表 当 前 定义 的 柔性 键 (rotatable)， 紫 色 代 表 当 前 未 激 
活 的 柔性 键 (non-rotatable)， 而 红色 代表 非 柔 性 键 (un-rotatable)。 在 弹出 的 Torsion Count 
对 话 框 中 有 几 个 按钮 ， 读 者 可 以 通过 它们 快捷 地 设置 柔性 键 ， 此 外 ， 读 者 还 可 以 利用 鼠标 
直接 在 3D 窗口 上 选择 或 屏蔽 柔性 键 。 


Ember of rotetable ида = 15 / 32 


Гу, Н Buke psgtida bachbonsa bonds non-rotetasla ; 


“Нан 000 інен: ЙШ 


图 5-30 ”选择 柔性 键 


g， 保 存 生 成 的 配 体 PDBQT 文件 ” 单 击 Ligand | Output | Save as РОВОТ 以 保存 生成 
的 配 体 PDBQT 文件 。 
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@ 刚性 受 体 文件 的 准备 

a， 获 得 受 体 文件 ”到 RCSB Protein Data Bank 下 载 研究 的 受 体 结构 . 

b， 检 查 并 完善 受 体 结构 ”首先 利用 VMD (Visual Molecular Dynamics) 或 ADT 等 可 
视 化 分 子 模拟 工具 检查 受 体 结构 是 否 完整 ， 然 后 删除 结晶 水 、 氧 原子 及 其 他 在 结晶 中 加 入 
的 离子 等 物质 (具体 方法 请 参考 VMD 手册 或 者 AutoDock 网 站 上 的 Using AtutoDock4 with 
ADT)， 然 后 将 处 理 好 的 受 体 另存 为 一 个 PDB 文件 。 

с ЖАМАН 用 File|Read Molecule 读 取 之 前 处 理 好 的 受 体 文件 。 

d， 受 体 分 子 加 H 读 入 受 体 分 子 后 ， 用 Edit | Hydrogens | Add， 在 弹出 的 Add 
Hydrogens 对 话 框 中 选择 АП Hydrogens、noBondOrders、yes。 可 以 选择 性 保存 加 过 正之 后 
的 刚性 受 体 文件 ，File | Save | PDB. 

e， 生 成 并 保存 刚性 受 体 PDBQT 文件 单 击 工 具 栏 上 的 AutoDock Tools 标志 调 出 
AutoDock 菜单 ， 在 AutoDock 菜单 上 选择 Grid | MacroMocule | Choose， 在 弹出 Choose 
Macromolecule 对 话 框 (图 5-31) 中 选择 欲 处 理 的 受 体 文件 (注意 ， 受 体 文件 也 加 全 本 并 确 
定 。 经 过 大 概 1s 的 运算 ， 会 弹出 一 个 警告 对 话 框 ， 如 图 5-32 所 示 ， 显 示 程 序 在 输入 的 受 
体 文件 中 发 现 了 1284 МЕЕ Н 原子 ， 并 已 将 它们 融合 到 其 母 原 子 上 。 点 击 ОК, ТЕЙ 
出 的 Modified AutoDock4 Macromolecule File 中 选择 欲 存 情 的 文件 名 和 路 径 以 保存 刚性 受 
体 的 РОВОТ 文件 。 实 际 上 ， 与 生成 配 体 的 PDBQT 文件 时 类 似 ， 这 一 步 也 包含 了 多 步 


nitializing receptor_1TCX.pdb: 
-found 1284 non-polar hydrogens 


图 5-31 选择 受 体 图 5-52 ”结果 对 话 框 


。 首先 ，ADT 检测 输入 的 分 子 是 否 存在 电荷 信息 ， 如 果 有 则 可 以 选择 保留 ， 如 果 没 
有 则 计算 Gasteiger 电荷 并 赋予 之 。 这 里 需要 注意 的 一 点 是 ， 计算 Gasteiger 电 集 需要 用 到 
全 原子 模型 ， 因 此 要 想得到 正确 Gasteiger 电荷 ， 必 须 保 证 输入 的 配 体 分 子 上 所 有 的 H 原 
子 都 已 经 被 加 上 。 

° 其 次 ，ADT 删除 所 有 非 极 性 H 原子 ， 并 将 其 电荷 分 配 到 其 相应 的 母 原子 上 〈 此 步 
又 可 以 通过 设置 File | Preferences | Modify Default | AutoDockTools | Automerge NPHS = 0 
ЖЕЕ). | 

е 最 后 ，ADT 为 受 体 中 的 每 一 个 原子 分 配 原子 类 型 并 生成 结果 报告 。 

© 半 和 柔性 受 体 文件 的 准备 ”在 AutoDock3 中 ， 受 体 分 子 被 视 为 完全 刚性 ， 即 使 是 受 
体 活性 口袋 区 域 的 柔性 也 没有 进行 任何 特殊 的 处 理 。 然 而 受 体 的 柔性 在 很 大 程度 上 决定 着 
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其 与 底 物 的 结合 方式 ， 一 个 典型 的 例子 是 细菌 质 膜 外 结合 蛋白 《periplasmic binding 
proteins)。 尽 管 在 一 级 结构 上 差别 很 大 , 但 是 这 一 类 和 蛋白 却 具有 一 种 非常 相近 的 三 级 结构 ， 
即 由 一 个 连接 结构 域 (interconnecting domain〉 和 和 两 个 球状 结构 域 (globular domain) 构成 ， 
两 个 球状 结构 域 位 于 两 人 出， 中 间 由 连接 结构 域 相连 。 此 类 重 白 一 般 游离 于 革 兰 阴性 菌 的 内 
膜 与 外 膜 之 间 ， 通 过 其 特殊 的 结构 与 功能 来 捕获 外 界 进入 的 营养 物质 ， 从 而 供 机 体 吸 收 。 

大 量 的 实验 和 模拟 结果 已 经 证 明 ， 在 捕获 其 底 物 的 过 程 中 ， 质 膜 外 结合 蛋白 连接 结构 域 向 
外 弯曲 ， 两 个 球状 结构 域 相互 靠近 ， 从 而 最 终 将 其 底 物 牢 牢 地 困 在 其 结合 口袋 中 。 由 于 质 
膜 外 结合 生日 的 球状 结构 域 的 大 规模 运动 很 像 捕 蝇 草 捕捉 小 昆虫 时 的 过 程 ， 因 此 形象 地 将 
质 膜 外 结合 蛋白 的 这 种 工作 机 理 称 为 “ 拉 晶 草 工作 机 理 ”。 

年 过 上 面 的 背景 知识 可 以 看 到 ， 在 很 多 情况 下 ， 仅 仅 考虑 配 体 的 柔性 是 远 远 不 够 的 。 
希望 能 有 一 种 方法 可 以 合理 地 、 快 捷 地 处 理 受 体 的 柔性 问题 ， 但 是 到 目前 为 止 ， 受 体 的 柔 
性 问题 依然 没有 得 到 很 好 的 解决 。 目 前 主要 有 两 种 考虑 受 体 和 柔性 的 方法 。 一 种 是 MD 模拟 
和 分 子 对 接 联 用 的 方法 ， 必 一 种 是 在 分 子 对 接 的 过 程 中 考虑 受 体 部 分 残 基 侧 链 和 柔性 的 方 
法 。 在 这 里 ， 主 要 讲解 在 AutoDock4 中 考虑 受 体 侧 链 柔性 的 方法 。 用 ADT 生成 柔性 受 体 
PDBQT 文件 的 步骤 如 下 。 

a， 读 入 受 体 文件 用 File|Read Molecule 读 取 之 前 处 理 好 的 受 体 文件 。 

b. 受 体 分 子 加 H 读 入 受 体 分 子 后 ,用 Edit|Hydrogens | Add, 在 弹出 的 Add Hydrogens 
对 话 框 中 选择 АП Hydrogens、noBondOrders 或 yes。 可 以 选择 性 保存 加 过 五 之 后 的 刚性 受 
体 文 忻 ，File | Save | РОВ. 

с. 生成 半 和 柔性 受 体 PDBQT 文件 ”此 步 操 作 由 三 部 分 组 成 ，(a) 定义 受 体 刚 性 部 分 
(实际 上 就 是 生成 一 个 刚性 受 体 PDBQT 文件 )，(b) 选择 欲 进行 柔性 处 理 的 残 基 ; (с) E 
义 柔 性 残 基 。 

е 定义 受 体 刚性 部 分 
这 一 步 与 前 面 生 成 刚性 受 体 PDBQT 文件 的 过 程 很 相似 。 单 击 工具 栏 上 的 AutoDock 
Tools 标志 调 出 AutoDock 菜单 ， 在 AutoDock 菜单 上 选择 Flexible Residues | Input | Choose 
时 会 弹出 一 个 Мегре Non-polar Hydrogens 对 话 框 来 询问 用 户 是 否 要 只 保留 极 性 H， 单 击 
Yes 以 确定 。 经 过 大 约 15 的 运算 , 程序 会 弹出 一 个 对 话 框 来 告诉 用 户 程序 已 经 完成 的 操作 。 

ADT 为 用 户 提供 了 强大 的 “选择 工具 ”, 在 此 向 读者 介绍 两 种 较 常 用 的 选择 操作 方法 ， 
读者 可 以 根据 自己 的 操作 习惯 选取 其 中 的 一 种 来 进行 选择 操作 。 

ЖЖ: СЕ shift+ 鼠 标 左 键 在 3D 窗口 内 直接 选择 欲 进行 柔性 处 理 的 残 基 中 的 某 个 
原子 ， 然 后 打开 菜单 栏 中 Select | Set Selection Level 菜单 ， 设 置 Selection level 为 Residue 
(图 5-33)。 此 时 读者 会 看 到 刚才 选择 的 点 〈 黄 色 叉 子 ) 已 经 扩展 到 了 整个 残 基 上 。 如 果 读 
者 想 连 续 选择 多 个 柔性 残 基 ， 只 需要 在 选择 过 程 中 按 住 shift 键 不 放 ， 然 后 用 鼠标 左 键 点 击 
欲 选 择 的 原子 即 可 。 

菜单 法 打开 Select 菜单 ， 读 者 可 以 看 到 它 包 含 了 很 多 的 子 菜单 ， 选 择 其 中 的 Select 
From String， 读 者 可 以 在 弹出 的 对 话 框 中 填 上 各 种 字符 串 组 合 来 进行 选择 。 假 如 选择 残 基 
号 为 1 的 Pro， 那 么 就 应 该 在 对 话 框 的 Residue 这 一 行 的 文本 框 中 填 入 PROI (注意 必须 为 
Ха), 然后 点 击 Add. 关 于 Select From String 的 具体 语法 读者 可 以 参考 ADT 手 册 ( 图 5-34)。 
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图 5-33 ”鼠标 法 选择 柔性 残 基 图 5-54 菜单 法 选择 柔性 残 基 


е ENRERE 
选择 Flexible Residues | Choose Torsions in Currently Selected Residues。 完 成 如 上 操作 


后 ， 程 序 会 隐藏 所 有 未 被 选择 的 残 基 而 只 留 下 欲 处 理 的 残 基 。 此 外 ， 程 序 还 会 弹出 一 个 
Torsion Count 对 话 框 。 与 设置 配 体 柔 性 键 时 类 似 ， 在 这 里 ADT 允许 用 户 激活 或 屏蔽 程序 
默认 的 柔性 键 。 онай мели Close кое 《图 5-35), 
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| | 
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图 5-55 ”定义 柔性 残 基 


d， 保 存 生成 的 配 体 PDBQT 文件 ”做 柔性 受 体 对 接 需 要 两 个 受 体 文件 ， 一 个 是 刚性 
受 体 PDBQT 文件 ， 一 个 是 柔性 残 基 PDBQT 文件 。 因 此 与 刚性 受 体 文件 准备 过 程 不 同 是 ， 
在 这 里 需要 分 别人 存储 上 述 两 个 受 体 PDBQT 文件 : 

单 击 Flexible Residues | Output | Save Flexible РОВОТ 以 保存 柔性 残 基 PDBQT 文件 。 

单 击 Flexible Residues | Output | Save Rigid PDBQT 以 保存 刚性 受 体 PDBQT 文件 。 

(2) 为 AutoGrid 的 生成 输入 文件 Grid Parameter File ”在 进行 AutoGrid 计算 之 前 ， 必 
须 生 成 其 输入 文件 ，AutoGrid 唯一 的 输入 文件 是 Grid Parameter File， 即 所 谓 的 СРЕ. GPF 
中 包含 了 所 有 的 AutoGrid 所 需要 的 信息 ， 比 如 要 计算 格 点 能 的 受 体 、 配 体 以 及 格 点 中 心 、 
范围 等 。 AutoGrid 会 为 配 体 当中 每 一 种 原子 类 型 计算 出 一 个 map。 这 些 тар 相当 于 能 量 参 
ЖҮРЕ, Н AutoDock 进行 分 子 对 接 运算 时 用 到 的 任何 配 体 - 受 体 之 间 的 相互 作用 能 都 可 以 从 
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这 些 能 量 库 中 通过 查 表 的 方式 获得 ， 从 而 大 大 地 节省 了 计算 时 间 。 除 了 上 述 map 外 ,ADT 
还 会 另外 计算 两 个 map 来 共 AutoDock 使 用 ， 一 种 是 静电 map， 另 一 种 是 去 容积 化 效应 
map。 通 过 以 上 叙述 可 见 ，map 的 数量 是 可 以 预先 确定 的 ， 比 如 配 体 〈 或 受 体 上 定义 柔性 
ЖӘЕ) 有 N 种 原子 类 型 (注意 ， 这 里 说 的 原子 类 型 是 指 AutoDock 中 规定 的 原子 类 型 ， 而 
个 是 指 pdb 中 的 元 素 类 型 )， 那 么 生成 的 map 的 数目 就 应 该 是 N+2。 利 用 这 个 关系 ， 可 以 
粗略 判断 AutoGrid 是 否 工 作 正常 。 此 外 ，GPF 实际 上 是 一 个 文本 文档 ， 在 生成 GPF Е, 
读者 可 以 用 ADT 任意 一 款 文本 编译 器 打开 GPF 对 其 进行 修改 。 用 АРТ 生成 GPF 的 方法 
如 下 。 

O 生成 刚性 对 接 的 GPF 文件 首先 ， 读 入 之 前 生成 的 配 体 、 受 体 的 PDBQT 文件 ， 
然后 单 击 工具 栏 上 的 AutoDock Tools 标志 调 出 AutoDock 菜单 ， 在 AutoDock 菜单 上 选择 
Grid | Macromolecule | Choose/Open 来 选择 或 打开 受 体 的 PDBQT 文件 。 之 后 会 弹出 一 个 对 
话 框 说 此 受 体 文件 已 经 包含 了 电荷 信息 ， 问 是 否 保留 ， 这 里 一 定 要 选择 保留 ， 否 则 程序 会 
用 当前 的 受 体 结构 重新 计算 电荷 。 由 于 现在 的 受 体 已 经 是 联合 原子 模型 (united-atom 
model) 的 了 ， 所 以 不 能 用 于 Gasteiger 电荷 的 计算 此外， 程序 还 可 弹出 另外 几 个 对 话 框 ， 
一 般 部 可 以 忽略 掉 ， 因 为 GPF 实际 上 是 一 个 很 简单 的 文件 ， 它 只 告诉 AutoGrid 如 何 去 计 
算 map， 并 不 包含 配 体 或 受 体 的 实际 信息 )。 

其 次 , 用 Grid | Set Map Types | Сһоове/Ореп Ligand 在 弹出 的 对 话 框 中 选择 配 体 文件 。 

FHR, 用 Grid | Grid Вох 打开 Grid Option 工具 (图 5-36) 对 每 个 方向 上 格 点 的 数目 、 
盒 于 的 中 心 以 及 格 点 间距 进行 调解 。 盒 子 的 大 小 由 各 方向 上 格 点 的 数目 和 格 点 间距 共同 决 
定 。 一 般 来 说 ， 盒 子 的 大 小 要 至 少 能 使 得 欲 对 接 的 配 体 分 子 即 使 在 其 最 伸展 的 状态 下 也 能 
在 盒子 内 上 自由 转动 。 盒 子 中 心 一 般 选 择 在 活性 位 点 中 心 。 格 点 间距 一 般 不 用 修改 ， 这 个 值 
越 大 则 格 点 越 密集 ， 计 算 的 格 点 能 也 越 准确 ， 但 是 计算 时 间 也 会 相应 增长 。 在 修改 各 个 参 
数 的 同时 ， 在 3D 窗口 中 读者 可 以 实时 观察 到 各 个 参数 对 盒子 的 大 小 及 位 置 的 影响 。 修 改 
完 相 应 的 参数 之 后 ， 通 过 Grid Option 工具 的 菜单 栏 File | Close Saving Current 来 关闭 此 工 
具 并 保存 参数 。 


z “piar mq a a = a F Ph 7” . 928008 = 
二 МЕ; 
Fi 
ЕГЕ. (с | 
mp 
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保存 GPF。 用 Grid | Output | Save GPF 来 保存 GPF. 

D 生成 半 和 柔性 对 接 的 GPF 文件 “为 半 柔 性 对 接生 成 GPF 文件 的 方法 与 为 全 刚性 对 接 
生成 GPF 文件 的 方法 一 样 ， 但 是 需要 注意 的 是 ， 在 用 Grid | Macromolecule | Choose/Open 
来 定义 刚性 受 体 的 时 候 要 选择 受 体 刚 性 部 分 的 PDBQT 文件 ,而 不 要 用 整个 受 体 的 PDBQT 
文件 作为 输入 。 读 者 只 要 时 刻 记 住 AutoGrid 格 点 能 计算 是 针对 刚性 受 体 和 配 体 而 进行 的 ， 
AutoGrid 不 能 用 于 柔性 残 基 和 配 体 的 格 点 能 计算 。 

(3) 为 AutoDock 的 生成 输入 文件 Dock Parameter File (ОРЕ) DPF 中 包含 了 Auto- 
Dock 所 需要 的 一 切 信息 ， 如 在 对 接 中 需要 用 到 的 map、 对 接 中 要 用 到 的 配 体 、 受 体 所 在 的 
文件 名 及 位 置 、 各 种 控制 Ашороск 运算 时 间 与 性 能 的 参数 等 。 

TE AutoDock4 H, 一 共有 4 种 不 同 的 对 接 算法 , 分 别 是 SA、GA、LS 和 GALS (LGA)， 
其 中 :SA 一 一 最 初 的 蒙特 卡 罗 模拟 退火 法 (Monte Carlo simulated annealing); бА-4Б 
统 的 达尔 文 遗 传 算法 (Darwinian genetic algorithm); LS 一 一 局 部 搜索 算法 (local search); 
GALS (LGA) 是 GA 和 LS 的 组 合算 法 ， 也 叫做 拉 马 克 遗 传 算 法 (Larmarckian genetic 
algorithm). 

每 一 组 算法 都 有 它们 自己 的 一 套 参数 ， 一 般 情况 下 不 需要 做 修改 。 与 GPF 一 样 ，DPF 
也 是 一 个 文本 文件 。 在 生成 DPF 后 ， 读 者 可 以 用 任意 一 款 文本 编译 器 打开 DPF 对 其 进行 
修改 。 

O 选择 刚性 受 体 单 击 Ашороск 图 标 调 出 AutoDock Tools 菜单 ， 选 择 Docking | 
Macromolecule | Set Rigid Filename， 在 弹出 的 对 话 框 里 选择 刚性 受 体 PDBQT 文件 并 
确定 


选择 柔性 残 基文 件 《 а» Ж. ага Tools Жат, 选择 saren | 
Macromolecule | Set Flexible Residues Filename, 在 弹出 的 对 话 框 里 选择 刚性 受 体 PDBQT Ж 
件 并 确定 。 同 样 地 ， 该 操作 并 不 会 读 入 柔性 残 基文 件 ， 而 只 是 告诉 程序 刚性 受 体 的 文件 名 。 
此 外 ， 如 果 选 择 进行 柔性 受 体 对 接 的 话 ， 在 最 后 生成 的 ОРЕ 中 会 出 现 一 个 flexres 参数 来 
告诉 AutoDock 柔性 残 基文 件 的 位 置 ， 而 在 刚性 对 接 中 则 没有 该 参数 。 

D 读 入 配 体 文 件 首先 将 配 体 的 PDBQT 文件 读 入 (File | Read Molecule), EE 
AutoDock Tools 菜单 中 ， 选 择 Docking | Ligand | Choose， 在 弹出 的 对 话 框 里 选择 配 体 的 
PDBQT 文件 并 确定 。 在 这 里 需要 注意 一 点 ， 虽 然 Docking | Ligand 菜单 中 也 有 Open 子 菜 
单 , 但 是 , 通过 该 命令 打开 配 体 文件 的 PDBQT 后 程序 经 常会 报错 , 并 且 导 致 无 法 存储 DPF 
文件 。 所 以 在 这 里 最 好 的 解决 办 法 是 读 入 配 体 的 PDBQT 文件 ， 然 后 用 Docking | Ligand | 
Choose 来 选择 配 体 。 

由 设置 对 接 参数 在 AutoDock Tools 菜单 中 ， 选 择 Docking | Search Parameter | 
Genetic Algorithm 以 调 出 Genetic Algorithm Parameter 编辑 窗口 (读者 也 可 以 根据 自己 需要 
选择 其 他 算法 )。 5-37 所 示 ， 读 者 可 以 自由 编辑 这 些 参 数 。 其 中 ，Number of GA Runs 
代表 着 要 执行 的 对 接 运算 的 次 数 ， 每 一 次 完整 对 接 运算 都 会 得 到 一 个 结合 模式 ，Maximum 
Number of evals 表示 在 一 次 对 接 中 最 大 的 运算 次 数 。 在 实际 应 用 中 ， 这 两 个 参数 有 时 需要 
做 些 调整 。 比 如 ， 为 了 得 到 较 合 理 的 聚 类 分 析 ，Number of GA Runs 通常 会 设置 为 100 或 
更 大 ， 而 Maximum Number of evals 则 要 根据 之 前 定义 的 柔性 键 的 数目 作 相 应 的 调整 ， 柔 
性 键 越 多 ， 这 个 值 越 大 。 除 了 图 中 所 示 的 这 些 参 数 外 ， 实 际 上 用 户 还 可 以 用 Docking | Edit 
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DPF 或 其 他 文本 编辑 器 打开 生成 的 ОРЕ 来 进行 更 细致 的 编辑 。 


р? ТЫН -i Fa Pai EE EEE ДИЕ ) 
Genetic Algorithm Parameters “下 “Puas ды inam 
r: ГҮ! [г ИР, | РЕТ EST EP: 
l, | = 4 Ten] a. з да ТҰҚЫЛЫН 


Wambor of GA Runs: (10, | 
Population Size: [150 | | 

| Kaximua Humber of evals: [medium [2500000 
Maximum Humber of generations: [21000 x 


| Maximum Number of top individuals 
that automatically survive: 


Rate of Cene Mutation: [0. 02 j" 
Rate of Crossover; [0. 8 | |Ë 
СА Crossover mode: [twopt ж)! : 


Mean of Cauchy distribution for 55. клан ака a 
gene mutation: ОВЕ E 


| Variance of Cauchy distribution кат. ШЕ Š | | 
gene mutation: ІШ 


i 
Number of generations for picking [ip ; 
worst individual: Ei 


Close 


Ассерї 


图 5-37 ”对 接 参 数 的 设置 


© 保存 DPF 在 AutoDock Tools 菜单 中 ， 选 择 Docking | Output | Lamarckian СА (4,2) 
保存 生成 的 DPF。 

(4) 运行 AutoGrid 由 于 GPF 中 参数 不 能 包含 路 径 ， 因 此 在 运行 AutoGrid 之 前 ， 首 
先 必 须 确 保 配 体 、 受 体 、 ERER PDBQT 文件 ,GPF 文件 在 同一 个 文件 夹 下 。 AutoGrid 
的 运行 过 程 如 下 。 

D 设置 AutoGrid 运行 参数 ”在 AutoDock Tools 菜单 中 ， 选 择 Run | Run AutoGrid 调 
出 Run AutoGrid 窗 体 。 如 图 5-38 所 示 ， 用 户 需 要 在 相应 的 位 置 填 入 进行 计算 的 计算 机 名 
(默认 为 ADT 所 在 的 计算 机 )、AutoGrid4 程序 所 在 的 路 径 、GPF 的 文 文件 名 及 路 径 、 输 出 
AutoGrid 的 log 文件 (GLG аи E 


图 5-38 AutoGrid 运行 参数 的 设置 


© 启动 AutoGrid 设置 好 AutoGrid 的 参数 后 ， 点 击 Launch 运行 AutoGrid。 用 户 可 
以 在 Linux 提示 符 下 输入 top 命令 并 回 车 以 查看 AutoGrid 的 运行 情况 。 

(5) 运行 AutoDock 与 运行 AutoGrid 一 样 ， 由 于 DPF 中 参数 不 能 包含 路 径 ， 因 此 在 
运行 Ашороск 之 前 ， 首 先 必须 确保 配 体 、 受 体 、 柔 性 残 基 的 PDBQT 文件 、DPF 文件 在 
同一 个 文件 夹 下 。AnutoDock 的 运行 过 程 如 下 。 

D 设置 AutoDock 运行 参数 Т Ашороск Tools 菜单 中 ， 选 择 Run | Run AutoDock 
调 出 Run Ашороск 窗 体 。 如 图 5-39 所 示 ， 用 户 需 要 在 相应 的 位 置 填 入 进行 计算 的 计算 机 
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名 《默认 为 ADT 所 在 的 计算 机 )、AutoDock4 程序 所 在 的 路 径 、DPF 的 文 文件 名 及 路 径 、 
输出 AutoDock 的 log 文件 “DLG 格式 ) 的 路 径 等 参数 。 


ИН ра 


Шасго Name: 
Host Name: 
| Program Pathname: Browse | | 


{| Parameter Filename: нн 
Log Filename: Бета 4 


ñ Nice Level: 
| Сай : autogridd -p -1& 
$ Launch 


5-39 AutoDock 运行 参数 的 设置 


©) 月 动 Ашороск 设置 好 AutoDock 的 参数 后 ， 点 击 Launch 运行 AutoDock。 用 户 
可 以 在 Linux 提示 符 下 输入 top 命令 并 回 车 以 查看 AutoDock 的 运行 情况 。 

3. 用 Python 脚本 操作 AutoDock 进行 分 子 对 接 

以 上 着 重 讲解 了 用 ADT 操作 AutoGrid、AutoDock 进行 分 子 对 接 的 方法 。 从 上 面 的 叙 
述 可 以 看 出 ，ADT 为 用 户 提 供 了 可 视 化 的 操作 环境 ， 可 使 初次 接触 AutoDock4 的 用 户 很 
快 学 会 用 AutoDock 对 接 的 方法 ， 然 而 ， 对 于 AutoDock 的 老 用 户 来 说 , 或 许 还 是 更 加 青睐 
用 脚本 语言 来 操作 AutoDock。 虽 然 在 AutoDock4 的 手册 中 并 没有 叙述 如 何 用 脚本 来 进行 
对 接 ， 但 实际 上 在 安装 ADT 的 时 候 ， 就 已 经 安装 了 运行 AutoDock 所 需 的 所 有 Python 脚 
本 程序 . 因此 , 对 于 AutoDock 的 老 用 户 来 说 , 依然 可 以 通过 写 脚本 的 方式 来 控制 AutoGrid 
和 Ашороск 的 运行 。 

(1) 为 Python 脚本 设置 环境 变量 (可 选 ) 在 用 Python 脚本 进行 操作 前 ， 最 好 为 其 添 
加 环境 变量 ， 否 则 每 一 次 操作 都 要 为 其 输入 相应 的 路 径 ， 不 仅 非 常 繁 琐 ， 而 且 容 易 出 错 。 
为 ADT 的 Python 脚本 添加 环境 变量 的 方法 如 下 。 

(D 打开 .bashrc 并 编辑 

vi .bashrc 

(2) 在 .bashrc 中 添加 如 下 环境 变量 


export 

PATH=$PATH:/home/USERNAME/ADTPATH/MGLTools-1.5.4/ 

MGLToolsPckgs/AutoDockTools/Utilities24 

其 中 USERNAME 为 用 户主 目录 ，ADTPATH 为 ADT 安装 目录 。 

(2) 用 Python 脚本 生成 配 体 、 受 体 的 PDBQT 文件 ”相对 而 言 用 Python 生成 
PDBQT 文件 的 过 程 较 简 单 , 一般 只 需要 一 行 命令 就 可 以 完成 配 体 或 受 体 的 PDBQT 文件 的 
和 准备。 生成 配 体 、 受 体 及 柔性 残 基 PDBQT 文件 的 Python 脚本 分 别 是 prepare ligand4.py、 
prepare_receptor4.py 和 prepare_flexreceptor4.py。 下 面 介 绍 这 三 个 脚本 的 使 用 方法 。 

(1) 用 prepare ligand4.py 来 生成 配 体 的 PDBQT 文件 ”首先 将 原始 的 配 体 、 受 体 坐 标 
文件 (pdb、mol2 或 раба 格式 ) 拷贝 到 同一 个 文件 坎 中 ， 然 后 进入 该 文件 夹 ， 执 行 如 下 
13: 

prepare ligand4.py -l Ligand ЕПепате -U nphs Ips 
其 中 Ligand Filename 为 配 体 坐 标 文件 ，nphs Ips 参数 说 明 将 配 体 分 子 上 的 非 极 性 H 原子 
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MM Е Ё Cone pair) “RA (merge)” 其 母 原 子 上 。 实 际 上 ，prepare ligand4.py 脚本 包 
含 了 很 多 可 选择 的 选项 ， 用 户 可 以 根据 自己 的 逢 要 将 不 同 的 参数 控制 项 添加 到 上 述 命 令 行 
中 。 读 者 可 以 直接 输入 prepare_ligand4.py 并 回 车 以 查看 prepare_ligand4.py 的 参数 列表 。 

用 prepare_receptor4.py 来 生成 刚性 受 体 的 PDBQT 文件 进入 受 体 坐 标 文件 所 在 
的 文件 严 ， 执 行 如 下 命令 : 

prepare_receptor4.py -r Receptor Filename -U прһв Ips 
其 中 Receptor Filename 为 受 体 坐标 文件 。 同 样 读者 也 可 以 直接 输入 prepare receptor4.py 
ЖІІЗЕ ЗЕ ргераге тесеріот4.ру 的 参数 列表 。 

用 prepare_ flexreceptor4.py 来 生成 柔性 残 基 的 PDBQT 文件 ”进入 受 体 坐 标 文件 
所 在 的 文件 夹 ， 执 行 如 下 命令 : 

prepare Пехгесеріог4.ру -r Receptor_Filename -s Flexible List -U nphs Ips 
其 中 Receptor_Filename 为 受 体 坐 标 文件 ，Flexible_List 为 柔性 残 基 列表 ， 其 语法 为 : 

分 子 名 : 链 号 ， 残 基 全 称 ， 分 子 名 : WS: 残 基 全 称 ，…… 

例如 :hsgl: A: ARGI, hsg1: A: LYVSS，……- (注意 ， 残 基 名 要 大 写 ) 
同样 读者 也 可 以 直接 输入 ртераге flexreceptor4.py 并 回 车 以 查看 prepare Нехгесеріюгі.ру 
的 参数 列表 。 

(3) 用 Python 脚本 生成 GPF 和 DPF 生成 GPF 和 DPF 的 Python 脚本 分 别 是 
prepare_gpf4.py 和 prepare_dpf4.py。 下 面 分 别 介绍 这 两 个 脚本 的 应 用 。 

QD 用 prepare_ 即 人 .py 来 生成 GPF 文件 首先 将 确保 配 体 、 受 体 的 PDBQT 文件 在 同 
一 个 文件 夹 中 ， 然 后 进入 该 文件 夹 ， 执 行 如 下 命令 : 

ргераге gpf4.py -1 Ligand РОВОТ -r Receptor PDBQT 
其 中 ые PDBQT 3 和 — PDBQT 分 别 为 配 体 与 受 体 的 PDBQT таг 

接生 成 GPF 文件 的 话 ， 则 F vapor г РОВС г и: = 


= "т И а 


体 网 部 КР ОТ тз. БЕ ERA ОЛАЙ чы P: ОБ TE: ee 

P 用 prepare "pas нтте DPF 文件 首先 确保 配 体 、 受 体 的 PDBQT 了 文件 在 同一 
个 文件 来 中 ， 然 后 进入 该 文件 来， 执行 如 下 命令 : 

prepare dpf4.py -1 Ligand PDBOQT -r Receptor РОВОТ 
其 中 Ligand PDBQT 和 Receptor PDBQT 分 别 为 配 体 与 受 体 的 PDBQT 文件 。 

(4) 用 命令 行 运行 AutoGrid 和 AutoDock 读者 可 以 用 如 下 的 命令 分 别 运行 AutoGrid4 
和 AutoDock4: 

autogrid4 -p СРЕ -1 GLG 

autodock4 -p DPF- -1 DLG 
Jeri: GPF, DPF, GLG 和 DLG 分 别 为 AutoGrid 参数 文件 、AutoDock 参数 文件 、AutoGrid 
输出 文件 和 AutoDock 输出 文件 。 这 里 需要 注意 的 一 点 是 ， 一 定 要 等 到 AutoGrid 计算 完成 
后 才能 运行 AutoDock， 而 且 还 要 确保 配 体 、 受 体 即 柔性 残 基 的 PDBQT 文件 和 AutoGrid 
生成 的 全 部 map 文件 在 同一 文件 夹 下 。 

由 于 Ашороск 运算 时 间 一 般 比 较 长 ， 因 此 可 以 在 后 台 提 交 作业 ， 命 令 如 下 : 

nohup autodock4 -p DPF- -1 DLG 

4. AutoDock 的 结果 分 析 | 
(1) УЛАН 一般 来 说 ， 评 价 对 接 结果 的 优 劣 一 般 有 三 个 原则 ， 即 结果 
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打分 〈score)、 聚 类 (clustering) 及 化 学 合理 性 (chemical reasonableness), 

O 打分 对 对 接 结 果 的 打分 是 对 对 接 优 劣 的 最 简单 、 最 直接 的 评价 。 在 AutoDock 
中 ， 对 接 结 结果 给 出 的 结合 自由 能 越 低 ， 则 说 明 对 接 得 到 的 复合 物 的 结合 模式 最 牢固 。 
此 ， 在 分 子 对 接 中 ， 一 般 来 说 ， 一 个 打分 较 高 〈 能 量 较 低 ) 的 构象 一 般 都 比 一 个 打分 较 低 
(EERE) 的 构象 要 更 有 说 服 力 。 然 而 ， 打 分 评价 标准 只 有 在 两 种 构象 的 打分 相差 较 大 
的 情况 下 才 有 意义 。 拿 AuotoDock 来 说 ， 其 结合 自由 能 的 计算 误差 在 2kcalmol 左右 ， 因 此 
不 能 说 一 个 结合 自 tid 的 结合 模式 要 优 于 一 个 -4kcal/mol 的 结合 模式 。 此 外 ， 
由 于 结合 自由 能 最 低 3 模式 未 必 就 是 天 然 状态 下 的 结合 模式 ， 所 以 ， 即 使 得 到 一 个 能 
量 明显 优 于 其 他 结合 模式 的 结果 ， 也 不 能 确定 它 就 是 正确 的 结合 模式 。 由 以 上 叙述 可 见 ， 
仅仅 依靠 对 接 打 分 来 评价 对 接 结果 显然 是 不 够 的 。 

聚 类 ” 聚 类 是 指 在 一 定 的 阅 值 (cutoff) 下 ,将 对 接 结果 按照 结构 和 能 量 上 的 差异 
进行 归 类 的 一 种 统计 学 方法 。 在 AutoDock 聚 类 分 析 中 ， 程 序 会 首先 按 结合 自由 能 从 低 到 
融 将 对 接 绪 果 排序 ， 然 后 再 按照 给 定 的 均 方 根 偏 差 (RMSD) 阔 值 来 对 排序 好 的 对 接 结 果 
进行 分 类 。 可 以 想象 ， 一 种 启 优 势 的 结合 模式 在 分 子 对 接 计算 中 被 发 现 的 概率 要 远大 于 那 
些 非 优 势 结 合 模 式 。 因 此 ， 有 理由 相信 ， 所 要 寻找 的 结合 模式 应 该 位 于 那些 聚 类 元 素 较 多 
的 类 当中 。 在 一 次 成 功 的 对 接 中 ， 其 聚 类 的 数目 不 应 过 多 ， 否 则 会 使 得 每 一 类 中 的 元 素数 
Нр; 此 外 ， 位 于 能 量 较 低 类 的 元 素数 目 应 明显 多 于 位 于 能 量 较 高 类 的 元 素数 目 。 一 般 
来 说 ， 如 果 能 找到 一 种 结合 模式 ， 其 能 量 较 低 、 聚 类 又 很 好 的 话 ， 那 么 该 结合 模式 就 比较 
可 能 是 正确 的 结合 模式 。 

© D 化 学 合理 性 ЕВА кеен н F ， 依 靠 个 人 的 化 


细节 有 : 氢 键 的 数目 与 形成 位 置 、 | КАКЫ И. 盐 桥 等 。 当 然 ， 如 果 在 对 
接 前 就 通过 阅读 文献 或 实验 结果 已 经 知道 了 部 分 结合 模式 的 信息 ， 如 配 体 的 整体 走向 ， 那 
么 必须 把 这 些 信 息 当 作 判 断 正 确 结合 模式 的 首要 标准 。 

(2) H ADT 分 析 Ашороск 结果 ”做 分 子 对 接 的 目的 就 是 要 预测 配 体 与 受 体 的 结合 
模式 。 上 面 已 经 讨论 了 选择 合理 结合 模式 的 标准 ， 以 下 简单 介绍 ADT 中 的 分 析 工 具 ， 并 
就 几 个 大 家 可 能 比较 关心 的 内 容 展开 讨论 。 

O ЖА DLG 文件 用 ADT 分 析 对 接 结 果 的 第 一 步 就 是 将 DLG 文件 导入 到 ADT 
中 ， 首 先 在 ADT 的 工具 栏 中 点 击 AutoDock 图 标 调 出 AutoDock Tools 菜单 ， 然 后 选择 
Analyze | Docking | Open 来 打开 欲 进行 分 析 的 DLG 文件 。 此 时 ，ADT 会 弹出 一 个 类 似 于 
图 5-40 的 对 话 框 ， 大 意 是 告诉 用 户 读 入 的 文件 名 及 构象 数目 ， 并 且 告 诉 用 户 可 以 用 
Analyze | Conformations | Play 菜单 来 观察 每 一 种 结合 模式 。 点 击 确定 ， 关 闭 该 对 话 框 。 

D 获得 每 种 对 接 模式 的 基本 信息 ”在 完成 一 次 对 接 计算 之 后 ， 都 要 检测 每 种 结合 模 
式 的 各 种 指标 ， 从 而 对 对 接 结果 进行 评价 。 可 以 通过 文 版 编辑 器 打开 DLG Хр, ЖЕН 
己 去 搜索 每 一 种 结合 模式 的 各 种 信息 。 除 了 这 种 方法 外 , АРТ 还 提供 给 一 种 可 视 化 的 手段 
来 检测 每 一 种 结合 模式 的 各 种 信息 。 

选择 Analyze | Conformations | Load 来 打开 Conformation Chooser 窗 体 。 如 图 5-41 所 
л, 该 窗 体 包含 上 下 两 个 部 分 , 下 半 部 分 列 出 了 所 有 的 结合 模式 的 聚 类 及 结合 自由 能 信息 ， 
而 上 半 部 则 列 出 了 相应 结合 模式 的 详细 信息 ， 如 打分 排序 (rank)、 结 合 和 自由 能 (binding 
nergy) 等 各 种 能 量 、 常 温 下 结合 常数 、 与 参考 构象 的 RMSD (Ref RMS)、 与 本 类 中 能 量 
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最 低 构 象 的 RMSD (Cluster RMS) 等 。 这 个 工具 除了 可 以 显示 不 同 构象 的 详细 信息 之 外 ， 
还 可 以 在 下 半 部 列表 中 通过 双击 任意 一 行 的 方法 来 显示 其 相应 的 3D 结构 。 为 了 方便 分 析 ， 
通常 还 需要 把 受 体 也 显示 在 3D 窗口 中 ， 这 一 点 可 以 通过 Analyze | Macromolecule | Open 
或 Choose 来 实现 。 


| ч ыдан Energ 
Unbound Extended barm "i, 83. 
| luster RHS: 
Ref RM5: > 01 


select from 2D dockings: 
(double click ta update coords) 
SubRarkE do 


cked energy) 


Read 20 docked conformations from ind_x1hpv.dlg 


Use Analyze-=Confvormations->Play... to view 


Туре 'self.docked.warnings' in python shell to list 1 waming 
message(s) from dig 


E 5-40 DLG 文件 导入 图 5-41 对 接 模式 信息 


О 获得 聚 类 信息 “如 上 面 提 到 的 一 样 ， 聚 类 分 析 是 评价 对 接 结果 优 劣 的 主要 指标 之 
一 。 实 际 上 ， 在 默认 情况 下 ， 聚 类 分 析 在 完成 对 接 运算 的 时 候 就 已 经 被 执行 。 有 兴趣 的 
读者 可 以 打开 一 个 DLG, 并 以 clustering 关键 字 进行 搜索 ， 然 后 观察 DLG 中 给 出 的 聚 关 信 
ind ms = 20 det ec д. 在 ADT тажа 恩 的 方法 为 
ктг Masa ПИШЕ ayze | Clustering | Show, ҰТА 
作 后 ， 程 序 会 弹出 一 个 包含 了 聚 类 信息 的 
直方 图 (图 5-42)。 通 过 观察 该 图 ， 不 仅 
可 以 清楚 地 获得 聚 类 信息 ， 而 且 还 可 以 通 
| ”过 用 鼠标 点 击 柱状 图 中 任 一 课 类 来 与 Зр 
| ”窗口 进行 互动 。 如 图 5-43 Br, 在 反击 了 
| ”第 一 类 之 后 ， 在 3D 窗口 中 会 出 现 一 个 类 
似 于 电影 放映 控制 条 的 工具 ， 用 它 可 以 将 
0.0 50 80 -70 60 -50 40 -30 .20 选 定 类 中 所 有 构象 依次 显示 在 20 窗口 
— Eeey -| 中 。 在 这 里 需要 提醒 大 家 注意 的 是 ， 之 前 
| 没有 执行 过 Analyze | Conformations | Play 
5-42 RRE DE 或 Play ranked by energy， 则 在 点 击 聚 类 直 
方 图 时 会 出 错 。 读 者 只 需 在 点 击 聚 类 直方 图 之 前 运行 一 下 Analyze | Conformations | Play 即 
可 避免 此 类 问题 。 
在 AutoDock4 中 ， 聚 类 分 析 的 闪 值 默认 为 2&。 对 于 一 般 的 小 分 子 配 体 来 说 ， 这 个 立 
值 是 比较 合适 的 ， 但 是 对 于 较 大 或 较 小 ,抑或 是 柔性 键 较 多 的 分 子 来 说 ， 这 个 值 就 需要 调 
整 了 ， 否 则 可 能 会 得 到 非常 不 合理 的 聚 类 信息 。 一 般 来 说 ， 对 于 较 大 的 或 柔性 键 较 名 的 配 
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体 ， 需 要 将 聚 类 阔 值 设置 大 些 ， 比 如 2.5 一 3 А; ПРИЧАО, АЯКО 
置 小 一 点 ， 比 如 1~1.5 及 。 聚 类 分 析 其 实在 运行 AutoDock 的 时 候 就 已 经 被 执行 了 ， 那 么 
是 否 意味 着 如 果 想 要 得 到 不 同 阔 值 下 的 聚 类 信息 就 必须 进行 多 次 对 接 计算 呢 ? 这 显然 是 
不 必要 的 。 只 需要 通过 外 部 工具 对 DLG 文件 中 所 提供 的 数据 在 不 同 的 阐 值 下 重新 进行 内 
类 分 析 就 可 以 得 到 新 的 聚 类 信 而 ADT Ñ. Re 


| "М Руан ч чиди ah Virant ў АРЕ: 
e n 


{т ЕТ сыз зінен и 6 сай bipi Семи Саме 


图 543 聚 类 来 与 3D 窗口 互动 图 


读者 可 以 通过 单 击 Analyze | Clustering | Recluster 调 出 Cluster Conformations 窗 体 ， 然 
后 在 Tolerances 后 面 的 文本 框 里 填 入 新 的 聚 类 阅 什 “可 以 填 入 多 个 ， 具 体格 式 见 图 5-44)， 
点 击 OK 以 进行 新 的 聚 类 分 析 。 之 后 ， 读 者 可 以 再 次 运行 通过 Analyze | Clustering | Show 
来 显示 聚 类 直方 图 。 


Clustering on Ad Energy 


Е тыа: = 2 eT 10 20 | 


I Qutputfile Name: 


图 5-44 ЖНА 


D 检查 结合 模式 ”在 通过 考察 结合 自由 能 及 聚 类 信息 之 后 ， 一 般 就 已 经 选 定 了 
一 些 可 能 的 结合 模式 。 接 下 来 是 对 选 定 的 结合 模式 进行 更 进一步 的 分 析 ， 如 和 毛 键 、 
疏水 、 静 电 等 相互 作用 是 否 合理 。 在 ADT 中 ， 可 以 把 受 体 和 选 定 的 结合 模式 一 起 读 入 到 
зр 窗口 中 ， 然 后 通过 各 种 操作 来 检查 选 定 的 结合 模式 。 由 于 这 些 分 析 涉 及 较 多 的 背景 知 
in, Ң Арт 在 分 析 功 能 上 并 不 出 众 ， 因 此 不 再 进行 详细 的 说 明 ， 有 兴趣 的 读者 可 以 自行 
研究 。 

(3) 提取 对 接 构象 ”读者 可 以 利用 ADT 菜单 栏 上 的 File | Save 方便 地 储存 当前 3D 
窗口 中 的 分 子 , 也 可 以 通过 写 shell 或 perl 脚本 的 方法 从 DLG 文件 中 提取 对 接 结果 。 例如 ， 
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读者 可 以 利用 如 下 shell 脚本 来 提取 对 接 得 到 的 所 有 复合 物 构象 ， 
##HHHH Begin the Shell Script ІНННННІ 
ligand=ligandname 
receptor=receptorname 
write а] complexes.py -d ./${ligand}_S{receptor}.dlg -r ./${receptor}.pdbqt 
-0 /р(ініз/%(гесеріог) _${ligand} 
for ((і-0;і<100:1--ғ)) 
do | 
pdbqt_to_pdb.py -f /pdbqts/$íreceptor;_$tligand)_$ti).pdbqt 
-0 .pdbs/$treceptor} S${ligand} $ 人 ,pdb 
done 
НАННЕ End the Shell Script #5989 
需要 注意 的 是 ， 在 运行 该 脚本 前 ， 读 者 需要 在 当前 工作 目录 下 〈DLG 文件 所 在 目录 ) 
下 分 剂 建立 名 为 pdbqts 和 pdbs 两 个 文件 夹 。 


三 、 实 例 分 析 

前 面 详尽 阐述 了 用 ADT 和 命令 行 来 操作 AutoDock4 进行 分 子 对 接 的 步骤 及 方法 ， 以 
下 将 通过 两 个 完整 的 实例 来 向 读者 阐述 AutoDock 在 实际 科研 工作 中 的 应 用 ， 

1. FRENE: HIV- 蛋白 酶 与 其 抑制 剂 的 结合 模式 研究 

为 了 验证 AutoDock4 的 对 接 效果 ， 在 这 个 例子 中 选取 晶体 结构 已 知 的 HIV-1 蛋白酶 - 
抑制 剂 复 合 物 来 进行 说 明 ， 具 体操 作 步 又 如 下 。 

© 从 RCSB Protein Data Bank (http:/wwwresb.org/) 下 载 蛋 白 酶 - 捉 制剂 复合 物 ，PDB 
号 ，1TCX。 

D 将 该 复合 物 读 入 VMD(http:/www.ks.uiuc.edu/Research/vmd/) 或 其 他 可 视 化 分 子 模 
拟 软 件 ， 并 将 受 体 、 配 体 另 存 为 单独 的 文件 〈 注 意 不 要 包含 结晶 水 或 其 他 杂质 )， 得 到 
ligand_1TCX.pdb 和 receptor_ITCX.pdb. 

(8) 用 ADT 3È python 脚本 对 ligand_1TCX.pdb 和 receptor 1TCX.pdb 进行 处 理 ， 生 成 
配 体 和 受 体 的 PDBQT 文件 ， 分 别 得 到 ligand_1TCX.pdbqt 和 grid receptor 1TCX.pdbqt 和 
flex_receptor 1TCX.pdbqt。 在 设置 配 体 柔性 键 时 选择 所 有 可 自由 旋转 的 单 键 ， 在 设置 受 体 
eh 


Ф ĦADT yp же жы aaa i туте 
жаі GPF DPF а дана T 和 Teceptor_ ITCXDPF。 и o 


= Же 
ЫНЫ а, ЫБ БЕТЕ EE өте ТЫ MEDEF 
ПЕР», = "ТЕР! LATE JEE pP ы а ГУЫ ға а Гу 

үт ЕЕ = 


ЕБІН 


Е 运行 Ашобтій, ， 生 成 下 一 步 所 震 的 m map p 文件 ， 主要 参数 设置 为 rep 60 66, 
spacing=0.375, ргідсетег-н ЖЕН НЕНІ ЛА», 

© 运行 AutoDock4， 得 到 结合 模式 ， 主 要 参数 设置 为 ;ga num evals=2500000, 
ga run=100, 

АЖ: 一 共生 成 了 100 个 对 接 模式 ， 其 中 最 好 的 结合 模式 与 晶体 结构 的 RMSD NH 
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0.714， 说 明 AutoDock4 能 够 较 好 地 预测 出 受 体 -小 分 子 配 体 的 复合 物 结构 。 

2， 多 构象 对 接 ，HIV-1 整合 酶 与 香 豆 素 (coumarin) 类 抑制 剂 NSC158393 的 结合 模 
式 预 测 

在 上 面 的 例子 中 ， 为 了 更 好 地 模拟 受 体 - 配 体 间 的 相互 作用 ， 利 用 了 AutoDock4 的 新 
特性 一 一 半 和 柔性 对 接 。 半 柔性 对 接 考 虑 了 受 体 的 侧 链 柔 性 ， 因 此 在 一 定 程度 上 解决 了 在 以 
往 的 全 刚性 对 接 中 设 有 考虑 受 体 活性 口袋 构象 变化 的 问题 。 比 起 传统 全 刚性 对 接 ， 
AutoDock4 的 半 条 性 对 接 已 经 取得 了 长 足 的 进步 ， 但 是 对 于 主 链 的 柔性 ，AutoDockd 依然 
无 能 为 力 。 为 了 在 对 接 中 考虑 受 体 主 链 和 柔性， 可 以 采用 多 构象 对 接 (relaxed-model) 的 方 
法 。 所 谓 多 构象 对 接 ， 就 是 在 进行 分 子 对 接 之 前 ， 先 通过 分 子 动力 学 (MD) 模拟 等 方法 
获得 N 个 受 体 构象 ， 然 后 将 欲 研究 的 配 体 分 别 与 这 N 个 受 体 构象 进行 对 接 ， 从 而 得 到 
NX ga run 个 复合 物 构象 。 

在 本 例 中 ， 采用 多 构象 分 子 对 接 的 方法 对 HIV-1 整合 酶 与 香 豆 素 (coumarin) 类 抑制 
剂 NSC158393 的 结合 模式 进行 了 预测 ， 具 体 步骤 如 下 : G) 从 RCSB Protein Data Bank 下 
载重 白 酶 -抑制 剂 复合 物 ，PDB 5: 1BL3; © 用 Sybyl 中 的 Loop Search 工具 将 缺失 的 残 
ЖК; © 用 NAMD 或 其 他 动力 学 程序 对 经 过 处 理 的 整合 酶 结构 进行 分 子 动力 学 模拟， 
从 得 到 的 分 子 动力 学 轨迹 中 挑选 出 12 个 差异 较 大 的 构象 作为 分 子 对 接 中 的 受 体 结构 ; 
用 ChemDraw 和 Chem3D 构建 并 优化 М8С158393 的 立体 结构 ; © 用 AutoDock4 对 
NSC15393 和 通过 MD 模拟 生成 的 12 个 受 体 结构 进行 分 子 对 接 , 操作 步骤 和 实例 1 中 的 步 
又 一 致 。 

Ж: 通过 多 构象 分 子 对接 , 共 获得 了 1200 个 可 能 的 NSC158393 与 HIV-1 整合 酶 的 
结合 模式 。 通 过 综合 考虑 这 些 结合 模式 的 能 量 、 聚 类 以 及 化 学 合理 性 ， 最 终 得 到 了 一 个 较 
为 合理 的 结合 模式 。 通 过 这 个 实例 ， 说 明了 多 构象 对 接 能 够 较 好 地 考虑 受 体 主 链 凶 性 。 当 
受 体 活性 口袋 区 域 的 柔性 较 大 时 ， 读 者 可 以 采用 该 方法 来 解决 受 体 主 链 的 柔性 问题 。 


白质 复合 物 的 结构 模拟 


第 一 节 ”蛋白质 与 蛋白 质 对 接 的 意义 


生物 体内 各 种 生命 信息 由 不 同 的 基因 经 转录 、 翻译 传递 到 相应 的 重 白 质 上 并 使 其 具有 
各 自 的 生化 特性 及 生物 学 活性 ， 但 每 个 蛋白 质 并 不 是 独立 地 在 细胞 中 完成 被 赋予 的 功能 。 
细胞 内 的 各 种 重要 生理 过 程 ， 如 基因 的 复制 、 转 录 、 翻 译 以 及 细胞 信号 转 导 、 细 胞 周期 调 
控 、 免疫 反应 等 都 是 通过 和 蛋 白质- 蛋白质 分 子 之 间 的 相互 作用 来 进行 的 。 各 种 重 日 质 在 细胞 
中 通常 与 其 他 蛋白 质 相互 作用 形成 大 的 复合 体 ， 在 特定 的 时 间 和 和 空间 内 完成 特定 的 功能 ， 
而 且 有 些 蛋 白质 的 功能 只 有 在 复合 体形 成 后 才能 发 挥 出 来 。 因 此 要 充分 理解 和 认识 细胞 复 
杂 的 生理 过 程 ， 必 须要 解析 和 蛋白质 复合 物 结构 并 了 解 蛋白 质 相互 作用 过 程 发 生 的 构象 变 
化 。 此 外 ， 和 蛋白 质 复合 物 的 结构 可 以 为 重 日 质 界 面 提供 信息 ， 可 以 协助 进行 药物 设计 ， 可 
以 帮助 人 们 了 解 信号 通路 和 评价 复合 物 的 杀 和 性 。 

由 于 当前 研究 结构 的 实验 方法 如 X 射线 衍射 和 核磁 共振 技术 的 限制 ， 解 析 宣 白质 复 
合 物 的 结构 非常 困难 ， 造 成 了 目前 已 知 结构 的 重 白 质 复合 物 非常 有 限 。 随 着 计算 机 处 理 能 
力 的 不 断 增强 ， 理 论 模拟 方法 得 到 迅速 发 展 和 广泛 应 用 ， 和 蛋白 分 子 对 接 是 一 种 预测 重 白 质 
相互 识别 以 及 相互 作用 的 工具 。 所 谓 重 白 分 子 对 接 就 是 根据 两 个 已 知 重 日 质 分 子 的 三 维 结 
构 ， 利 用 理论 模拟 手段 考察 它们 之 间 是 否 可 以 结合 ， 并 预测 复合 物 的 结合 模式 。 甩 用 分 子 
对 接 方法 研究 蛋白 质 分 子 间 相互 作用 与 识别 ， 进 而 预测 复合 物 结构 。 鼻 白质 分 子 对 接 已 成 
为 研究 蛋白 质 与 蛋白 质 相互 作用 问题 的 有 力 的 计算 机 模拟 手段 ， 并 可 为 实验 工作 提供 有 益 
的 理论 指导 。 

目前 已 经 有 了 几 款 比较 流行 的 大 分 子 对 接 软 件 如 ZDOCK、RosettaDock (К”ОСК), 
Hex 等 。 在 这 一 章 里 ， 主 要 为 大 家 介绍 其 中 两 种 。 


第 二 节 ”利用 ZDOCK 来 研究 蛋白 质 -蛋白 质 的 对 提 


在 DS 中 ， 可 以 使 用 ZDOCK 来 实现 蛋白 质 的 对 接 计 算 。ZDOCK 是 一 种 基于 快速 情 
里 叶 转 化 相关 性 技术 的 刚性 蛋白 对 接 算法 。 算法 中 快速 传 里 叶 转 化 相关 性 技术 被 用 来 所 搜 
蛋白 -蛋白 系统 的 平 动 和 转动 空间 。RDOCK 是 一 种 基于 CHARMm 的 能 量 优化 过 程 ， 它 被 
用 来 优化 ZDOCK 所 寻找 到 的 蛋白 -蛋白 复合 物 的 结合 构 型 ， 并 使 用 比 量 打分 函数 给 这 些 结 
合 构 型 打分 。 本 实例 中 ， 将 会 使 用 ZDOCK 来 进行 蛋白 对 接 的 实验 ， 分 析 对 接 的 结果 ， 
并 从 中 选取 一 些 结合 构 型 ， 利 用 RDOCK 进行 优化 。 本 实例 的 蛋白 对 接 实 验 中 ， 选 用 牛 В- 
胰岛 素 (PDB ID 2ptn) 作为 受 体重 白 ， 另 外 一 个 胰岛 素 抑 制剂 CMTI-I (PDB ID 2sta, I 
链 ) 作为 配 体 和 蛋白。 该 牛 B- 胰 岛 素 及 其 抑制 剂 CMT- 复合 物 的 晶体 结构 为 Ippe. 
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、 设 定 一 次 ZDOCK 计算 
1. ZA 个 3D 窗口 中 打开 受 体重 白 和 配 体 和 蛋白 
在 File 中 , 找到 2ptn.pdb 文件 , 双击 。DS 将 在 一 个 新 的 3D 窗口 中 打开 该 蛋白 。 然 后， 
找到 2sta-Lpdb Хғ, 把 它 拖 搜 到 同一 的 3D 窗口 中 (图 6-1), 


| Әріп ~ Molecule Window Xi 


图 6-1 在 同一 个 3р 窗口 中 打开 受 体 蛋白 和 配 体 蛋白 


2. 打开 蛋白 对 接 Protocol (ZDOCK) 并 修改 参数 

Protocol 中 ， 展 开 Protein Modeling 文件 夹 ， 双 击 Dock Proteins (ZDOCK), DS 将 在 
Parameter 中 开打 参数 设置 界面 。 
在 Parameter 界面 中 ， 点 击 Input Receptor Protein 参数 ， 选 择 2ptn : 2ріп; Art Input 
Ligand Protein 参数 ， 选 择 2ptn : 2sta; СА to Size Ж. К с 
2 注意 : ZDOCK HARPA НАН ИНТЕ ӨКІ 67 Su ISP. 
采样 角度 为 6” 时， 预测 结果 更 为 准确 ， 因 为 Кн КаК, қ: А 0 个 人 GA. 
管 采样 角度 为 15° 时 的 结果 准确 性 有 所 下 降 (因为 它 的 采样 数 只 有 3600 049, тим 
间 更 短 。 

展开 Clustering 参数 组 , 点 击 RMSD Cutoff 参数 ， зина 6. Am ба Cutoff 
参数 ， 将 该 值 设 置 为 9。 点 击 Maximum Number of Clusters 参数 ， 将 该 值 设置 为 60。 

本 实例 中 使 用 的 配 体 抑制 剂 较 小 ， 对 于 这 样 小 的 体系 ， 将 RMSD Cutoff 设置 为 6 А 
的 cluster 半径 并 同时 将 Interface Сшо 设置 为 9 А 能 够 产生 更 好 的 cluster 结果 。 本 实例 
中 的 ZDOCK 运算 ， 将 不 指定 blocked residues 也 不 会 滤 除 结合 位 点 的 氨基 酸 。 

如 采 有 数据 表明 某 些 氨基 酸 残 基 不 可 能 出 现在 蛋白 -蛋白 的 作用 界面 ， 那 么 在 受 体 蛋 
白 中 选中 这 些 残 基 ， 然 后 设 定 Receptor Blocked Residues 参数 为 Create New Group from 
selection。 同 样 的 ,也 可 以 通过 设置 Ligand Blocked Residues 参数 来 指定 配 体 蛋白 中 不 可 能 
出 现在 界面 上 的 残 基 。 

如 打 有 数据 表明 ， 某 些 氨 基 酸 一 定 会 出 现在 蛋白 质 -蛋白 质 作 用 界面 上 ， 那 么 选中 它 
ІП. 然后 展开 Filter Pose 参数 组 , 设置 Receptor Binding Site Residues 参数 和 Ligand Binding 
Site Residues 参数 为 Create New Group from selection, 
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Filter Poses 功能 也 可 以 在 ZDOCK 计算 完 后 单独 运行 ， 使 用 Process Poses (ZDOCK ) 


protocol 即 可 。 

3. 运行 ZDOCK 并 查看 结果 

在 Protocol 中 ， 点 击 车 运行， 等待 结果 完成 。 计 算 费 时 约 8min。 计 算 结束 时 ，DS 
会 出 现 Job Completed 对 话 框 。 

在 Job 中 ， 双 击 完成 的 计算 任务 。DS 将 新 打开 一 个 Report.htm 文件 。 

在 Output Files 部 分 ， 点 击 ZDockResults.dsv 链接 (图 6-2). 


二 、 分 析 ZDOCK 结果 

1， 观 察 ZDOCK 结合 构 型 的 聚 类 (Cluster) 结果 

在 Hierarchy View 中 ， 展 开 Docked Poses 和 Clusters。 这 将 打开 几 组 Clusters 和 poses 
《图 6-3)。Cluster 1 为 最 大 的 聚 类 (包含 的 poses 最 多 )， 后 续 的 聚 类 越 来 越 少 。 
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图 62 查看 ZDOCK 结果 图 63 Clusters 和 poses 


在 Data 中 ， 点 击 ProteinPose „ 
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这 将 显示 如 下 关于 ZDOCK 计算 后 的 信息 : 

e ZDock Score 一 一 包含 每 个 对 接 构 型 的 ZDOCK 分 数 (PSC 打分 函数 )，Pose 1 
ZDOCK 分 数 最 高 

е Cluster 一 一 指明 每 个 对 接 构 型 所 属 的 聚 类 组 

е ClusterSize 一 一 报告 每 个 聚 类 含有 的 对 接 构 型 的 个 数 

е Density 一 一 报告 聚 类 过 程 中 邻近 的 对 接 构象 数目 

关于 聚 类 算法 的 详 述 ， 可 以 参考 Discovery Studio Help 中 的 “Clustering and analysis of 
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docked protein poses”, 

在 Toos 中 ， 选 择 Protein Modeling。 这 将 打开 Protein Modeling 的 工具 面板 。 

在 Analyze Docked Proteins 工具 面板 中 的 Clustering 工具 组 中 ， 点 击 Show Cluster 
кенді 然后 点 击 Show Full Cluster。 这 使 DS 的 显示 在 所 有 的 对 接 构 型 和 聚 类 中 心间 进行 

2， 对 结合 构 型 作 图 

以 下 的 步骤 将 解释 如 何 使 用 不 同 的 方法 ， 借 助 plots 和 Analyze Docked Proteins 工具 
来 帮助 观看 对 接 构 型 ， 并 选择 一 部 分 ZDOCK 的 对 接 构 型 进行 进一步 的 RDOCK 优化 。 

在 Hierarchy view rh, 按 住 SHIFT, 选择 Cluster 1—Cluster 10, 这 将 选中 Clusterl~10。 

在 Data Table 中 ， 点 击 ProteinPose， 从 菜单 栏 中 ， 选 择 Chart|3D Point Plot。 这 将 打开 
— Choose Plot Axes 的 对 话 框 。 在 对 话 框 中 ， 选 择 ZDock Score EX Х $h, Cluster 作为 
Y ey Density 作为 Z $, Color 轴 选 择 ZDock Score, 点 击 OK. DS 将 产生 一 个 Зр Point Plot 
(图 6-4)。 


图 6-4 Зр Point Plot 


点 击 ZDockResult-3D Point Plot， 拖 搜 该 窗口 ， 以 使 能 够 同时 看 到 ZDockResults-3D 窗 
ГІ СЁ 6-52. 


Весн Ponss 


ТҮН 


图 6-5 ZDockResults-3D 窗口 
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在 View toolbar 中 ， 点 击 Select 工具 ， 选 中 ZDockResult-3D Point Plot 窗口 中 的 一 些 
high ZDock scores. high Density values 和 low Cluster number 的 对 接 构 型 。 选 中 的 对 接 构 型 
在 3D 窗口 中 也 被 选中 。 

点 击 ZDockResult-3D 窗口 , 在 Hierarchy View 中 的 Cluster 组 中 , 点 击 Cluster 2 将 其 
选中 。 

在 Tools Ехріогеге 中 的 Analyze Docked Proteins 工具 面板 中 ， 在 Display 工具 组 中 ， 
点 击 Show Full Docked Complex。3D 窗口 中 将 显示 Pose 329 的 对 接 构 型 。Hierarchy View 
中 也 会 显示 Pose 329 蛋白 复合 物 中 受 体 和 配 体 的 名 字 : Pose329 2ріп 和 Pose329 2sta (图 
6-6). 

在 Analyze Docked Proteins 工具 面板 中 ， 点击 Show Next Docked Complex, 3D 窗口 中 
将 出 现 Pose 330 的 对 接 构 型 。Hierarchy View 中 也 会 显示 Pose 330 蛋白 复合 物 中 受 体 和 配 
体 的 名 字 : Pose330 2ptn 和 Pose330 2sta (图 6-7)。 


图 6-6 Pose 329 的 对 接 构 型 图 6-7 Pose 330 的 对 接 构 型 


点 击 Show Next Docked Complex 或 Show Previous Docked Complex， 可 以 观察 各 个 不 
同 的 对 接 构象 。 返 回 ， 并 显示 Pose 1。 在 Hierarchy View 中 ， 点 击 Posel_2ptn。 这 将 选中 
整个 受 体重 日 。 

在 Analyze Docked Protein 工具 面板 中 , 点 击 Identify Binding Interface。 这 将 选择 受 体 
和 配 体 对 接 界面 的 氨基 酸 。 | 

E RMSD 工具 组 中 ， 点 击 Define RMSD Reference, iXZE Hierarchy View 中 将 添加 一 
个 叫 Pose 1 Pose RMSD_ REFERENCE 的 组 。 这 个 pose 将 用 作 计 算 RMSD 值 的 参考 pose. 

3. 计算 RMSD {Ë 

在 Analyze Docked Proteins 工具 面板 中 ，RMSD 工具 组 ， 点 击 Calculate Binding Site 
RMSD (ZDOCK )。 

这 将 在 Data 中 的 ProteinPose 添加 一 列 名 为 RMSD to Posel POSE RMSD REFE- 
RENCE 的 列 〈 图 6-8)。 
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图 6-8 添加 POSE RMSD REFERENCE 的 列 


Cluster 48 中 的 许多 poses 都 与 PDB 1ppe 中 的 结合 模式 相近 。 


“提示 : E Data 中 的 ProteinPose 中 ， жін RMSD to Posel POSE RMSD REFERENCE 
A I (图 69)。 ` Ta 


=. 利用 RDOCK 优化 对 接 构 型 | — Clute ОШ to Posel РОЗЕ МІ REFERENCE 
1， 设 置 RDOCK protocol Р = күң 
Ж B] ZDockResults-3D Window 和 з 48 2.491 
ZDockResults-3D Point Plot Window HH. f = ае 
Hiti Dock Proteins (ZDOCK)-Html Window, 6 а 3.409 
在 Output Files 部 分 ， 点 击 ZDock- С © сай 
Results.dsv 打开 一 个 新 的 ZDockResults 的 | g 2 001 6 182 
3D 窗口 110 2,001 7.938 
j Íi 2,001 8.119 
CHARMm Polar H 力 场 进 行 赋值 。 图 6-9 将 рове 排序 


Tools 中 , 选择 Simulation。 这 将 打开 Simulation 工具 面板 。 在 Forcefield 工具 面板 中 ， 
选择 CHARMm Polar H， 然 后 点 击 Apply Forcefield。 这 将 把 CHARMm Polar Н АС 
受 体 和 配 体 蛋白 。 工 具 面 板 中 将 显示 ZDockResults typed with CHARMm Polar Н 的 状态 。 

在 Protocols 中 的 Protein Modeling 文件 夹 ， 双 击 Refine Docked Proteins (RDOCK) 
protocol。 这 将 在 参数 中 打开 RDOCK 的 参数 设置 。 

在 Protocols 中 ， 点 击 Input Typed Receptor Protein 参数 ， 选 择 ZDockResults:2ptn， 点 
rH Input Typed Ligand Protein 参数 ， 选 择 ZDockResults:2sta_I。 

本 例 中 , 将 选用 排名 前 六 位 的 对 接 构 型 中 的 一 些 来 进行 RDOCK 优化 。 考 虚 到 晶体 结 
构 中 ， 抑 制剂 蛋白 CMTI-I 的 结合 loop 中 N 端的 Arg505 是 主要 的 锚 定 氨基 酸 ， 观 察 前 六 
位 的 对 接 构 型 ， 发 现 只 有 posesl. ровев2. poses3 和 роѕеѕб 满足 上 面 的 要 求 。 所 以 将 采用 
这 4 个 poses 来 进行 优化 。 

在 Hierarchy View 中 的 Docked Poses HHF, Е CTRL 键 ， 点击 选中 posesl, poses2, 
poses3 和 poses6 , fE Parameter Explorer ЧЕ, Att Input Poses 参数 ,选择 Create NewGroup from 
selection… 系 统 默认 生成 一 个 新 的 名 为 Group 的 组 。 

在 Protocl 工具 条 中 ， 点 击 - 肝 > 运行 ， 等 待 计算 完成 。 计 算 费 时 为 约 几 分 钟 。 计 算 结束 
时 ，DS 会 出 现 Job Completed 的 对 话 框 。 

2. 观察 结果 

在 Jobs 中 ， 双 击 job. DS 将 打开 一 个 名 为 Report.htm 的 文件 。 点 击 该 窗口 Output File 
部 分 的 View Results, 
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DS 将 打开 一 个 新 的 3D 窗口 ， 所 有 四 个 经 过 RDOCK 优化 的 对 接 构 型 均 在 该 窗口 中 
СЕ 6-10). 
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ІН 6-10 对 接 3D 窗口 


在 表格 中 ， 有 RDOCK 所 计算 的 各 能 量 值 的 列表 。 

е E elecl and E_elec2 一 一 经 过 第 一 、 二 轮 CHARMm 能 量 优 化 后 蛋白 质 复 合 物 的 静 
电能 

g E ` 
德 华 非 键 作 用 能 

е E_sol 一 一 香 白 质 复合 物 的 去 溶剂 化 能 

е E RDock 一 一 RDOCK 分 数 的 定义 为 : E elec2 + beta*E sol 

在 表格 中 ， 点 击 理 可 以 看 到 第 一 个 pose 的 3D HR. 分别 点 击 + ЖП Ф 可 以 查看 上 一 
个 和 下 一 个 pose 的 结构 。 

3. 选择 相互 作用 界面 的 氨基 酸 

在 Hierarchy View 中 ， 展 开 Selected pose， 选 择 受 体 和 蛋白 A. 

ТЕ TooLs 中 ， 选 择 Protein Modeling。 这 将 打开 Protein Modeling 工具 面板 。 

TE Analyze Docked Proteins 工具 面板 中 的 Display LRH, Hit Define Receptor, іХ 
将 定义 A 为 受 体 蛋 白 。 

在 Analyze Docked Proteins 工具 面板 中 的 Display 工具 组 中 ， 点 击 Identify Binding 
Jnterface。 这 将 选中 受 体重 白 和 配 体 抑制 剂 间 相互 作用 的 氨基 酸 。 

提示 : 用 以 定义 结合 界面 的 Distance Cutoff {È ñ] El ZE Preferences "а. 从 菜单 * 
选择 Edit | Preferrences | Protein Docking. SUEY 5Å. О 


四 、 使 用 RMSD 分 析 结 合 界面 的 氨基 酸 
本 小 节 中 ， 将 把 对 接 的 构 型 与 晶体 结构 中 的 蛋白 质 复 合 物 PDB Ippe 进行 比较 。 


· #6 CHARMm 能 量 优 化 后 蛋白 质 复 合 物 的 范 
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1. 打开 PDB Ippe 

从 菜单 栏 中 ， 选 择 File | Insert From | URL。 这 将 打开 一 个 从 URL 中 Insert 结构 的 对 
话 框 。 输 入 Ірре, тї Open。 这 将 在 以 后 的 3D 窗口 中 插入 1рре 的 结构 。 

在 Hierarchy View 中 ， 展 开 Cell， 然 后 展开 1ppe。 选 中 water， 点 击 Delete 键 。 这 将 
删除 Ippe 中 的 水 分 子 。 在 Hierarchy View 中 ， 展 开 Cell, RAER 1ppe。 从 菜单 栏 中 ， 选 
FF Sequence | Show Sequence。 这 将 打开 一 个 Sequence 窗口 (图 6-11). 


Ippa = Holucala Тісіст TlackR&anulis = Holecula Тіміст - ШЖарагї = а] Finis Иол а = Ше] с1а Тігіст | Wal ата а бататын Тісін ы | 8 
нинин M 


Рейнс 


Fawal 


ІН 6-11 Sequence 


在 计算 RMSD 之 前 ， 对 接 的 构 型 需要 与 Ippe Ж-Н КИТӘ А. 

2， 将 对 接 构 型 与 1ppe # | 

点 击 Molecule 窗口 使 之 激活 。 在 Hierarchy View 中 ， 点 击 chain E。 这 将 选中 1рре 中 
的 受 体 蛋白 。 从 菜单 栏 中 ， 选 择 Баи | Preferences。 这 将 打开 Preferences 对 话 框 。 从 菜单 
栏 中 ， 选 择 Structure | Superimpose | By Sequence Alignment… 这 将 打开 Sequence Alignment 
对 话 框 。1ppe 作为 参考 分 子 。 

对 三 框 (图 6-12) 中 ， 选 取 所 有 的 poses。 点 击 ОК. 


Referenca molecule: 


Sequence alignment: 
Molecules іс superimpose: 


| | Selected reference residues only 
(5) C-Klpha etom in sach гакіёце (7) Bain-chsin atoms of each reridue 


Transformation matricës added into molecules to supérimpose with nabe: NCS m jj | 
ГІ Generate transformation matrix only ерлк 


6-12 Sequence Alignment 


ТЕ Molecule 窗口 中 ， 核 实 1ppe ЖЕН E 仍然 被 选中 。 
在 Tools 中 的 Analyze Docked Proteins 工具 面板 中 ， 先 点 击 Define Receptor， 再 点 击 
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Indentify Binding Interface。 这 将 选中 受 体 - 受 体 蛋 白 中 的 氨基 酸 。 

3. 计算 结合 界面 氨基 酸 的 RMSD È. 

从 菜单 栏 中 ， 选 择 Structure | RMSD | By Sequence Alignment… 这 将 打开 RMSD by 
Sequence Alignment 的 对 话 杠 (图 6-13). 


Қағагяпса вої есеї е 


Sequence а1: мапі; 
(4) А11 rasiduan С) Selectad тезі физ 


imino асі йз 
| repa: 
E Main-chain 
Гена sia chain itema 


ГІ ALI matching hagyy atom: 


Report ай residue levi 


ЕН 6-13 RMSD by Sequence Alignment 


在 该 对 话 框 中 ，Reference molecule 选择 1ppe。 点 击 Selected residues, ЭС Report at 
residue level 选项 。 点 击 OK。DS 将 在 一 个 新 的 窗口 中 打开 一 个 基于 选中 和 氨基酸 的 RMSD 
报告 (图 6-14)。 


RMSD Report using Selected Residues for Molecule 


RMSD Calculation of reference lppe versus all aligned molecules 
Molecule Reference Main-chain 


Pore ippa z. 228 
Боза ірет 1,509 
Posl ірге 3,43Е 
Әсзеб ірге 4,39% 


图 6-4 选中 氨基 酸 的 RMSD 


第 三 全 ”利用 Hex 研究 大 分 子 与 大 分 子 之 间 的 相互 作用 


上 一 节 介 绍 了 比较 流行 的 大 分 子 对 接 软 件 ZDOCK， 在 本 节 ， 主 要 介绍 用 Нех 研究 大 
分 子 与 大 分 子 之 间 的 相互 作用 。 

Нех 是 由 苏格兰 Dave Ritchie 小 组 开发 的 一 种 研究 大 分 子 与 大 分 子 之 间 相 互 作用 的 软 
件 ， 它 不 仅 可 以 实现 重 白 质 - 重 白质 的 对 接 ， 还 可 以 实现 蛋白 质 -核酸 的 对 接 。 与 其 他 单 分 
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子 对 接 软件 相 比 ，Hex 具有 简单 易 用 和 运算 速度 快 两 大 优势 。 所 谓 简单 易 用 ， 是 因为 Hex 
是 一 款 图 形 用 户 界 面 化 的 对 接 软件 。 在 Нех 中 ， 从 对 接 前 分 子 的 处 理 到 对 接 后 的 分 析 ， 所 
有 的 操作 都 可 以 在 图 形 用 户 界 面 下 完成 ， 这 就 使 得 初次 接触 大 分 子 对 接 软 件 的 用 户 能 够 很 
快 的 熟悉 Hex 的 操作 。 此 外 ， 由 于 Hex 在 对 接 中 采用 了 Spherical Polar Fourier 算法 ， 因 而 
使 得 其 运算 速度 大 幅 提高 。Hex 的 设计 者 甚至 宣称 其 计算 速度 比 采 用 传统 快速 傅 里 叶 变换 
( fast Fourier transform) 算法 的 对 接 程序 运算 速度 快 10 倍 。 


一 、Hex 的 安装 
Нех 的 安装 很 简单 , 只 需要 到 Hex 的 官方 网 站 (http://www.csd.abdn.ac.uk/hex) 下 载 Hex， 


H| 
t 
epp 2 ос МЕРЕТ БЕГЛ з ТАЛ ГЫ АВН КОНЕВА ЕЧ. ВАР EL u | 


6-15 Hex 主 界 面 


Z., Hex 的 基本 应 用 

Hex 的 操作 比较 简单 ， 对 接 中 的 所 有 步骤 都 可 以 在 
Hex 所 提供 的 图 形 用 户 界面 下 完成 。Hex 的 操作 流程 如 图 
6-16 所 示 ， 可 以 分 为 4 个 步骤 。 

1， 配 体 和 受 体 文件 的 准备 

Hex 的 输入 文件 只 需要 两 个 PDB 文件 (一 个 配 体 ， 
一 个 受 体 )。 在 进行 对 接 之 前 ， 必 须 确保 这 两 个 PDB 文件 
不 能 包含 结晶 水 或 其 他 杂质 的 数据 。 读 者 可 通过 File | 
Open | Receptor 和 Ligand 分 别 读 入 受 体 及 配 体 文件 。 对 于 
PDB 文件 中 所 含 的 杂质 厚 子 , 读者 可 以 用 Hex 中 Controls 
| Heteros 菜单 调 出 的 Hetero Control Ж СЁ 6-17) 来 将 
其 屏蔽 掉 (取消 选择 Enable Solvent 及 Enable Hetero 复 选 6-16 Hex 的 操作 流程 


准备 配 体 、 受 体 文 忻 (PDB Ж 
式 ， 不 包含 水 或 其 他 杂质 ) 


| 
调整 配 体 与 受 体 之 间 的 
相对 位 置 及 角度 
І 


根据 实际 情况 调整 对 
接 参 数 并 对 接 
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ЖЕ), нышаны 3D 窗口 中 用 灰色 表示 。 


Ё ез: ЧЫНЫ 
Ë Fie Controis Graphics Macros в нер 


— L - = E 
| Шш EE Display Нећего 
і 型 | Г Enable Hetero 


Г Display Solvent 
! $| -«Епазіг Solveni 
i „А | Г Епабіе Атой үз 
J —IToggle Picked IDs 


| m | Аррутә: |а | 
| <l Й Сшизомеп) — Dismiss | | 


ке кк от мг le ie le ep е 


E ыа саша dki : 


|J m [ое : A 
n Es i сайы PP аны 


ы ны dit Р daken „ыы. ШЕ, ы: бы Ыш Ны ЖЫЙ ЕЕЕ c Ега Б L: = шаа ақан ыры арены. 


图 6-17 配 体 和 受 体 文件 的 准备 
此 外 ， 也 可 以 通过 File | Open | Complex 选择 性 的 读 入 一 个 复合 物 文件 。 若 读 入 了 复 


екем „шш > saa еа Е жч асси ыз RMSD。 


2. De 

首先 要 明确 一 点 ，Hex 的 对 接 结果 是 和 配 体 、 受 体 对 接 前 的 相对 位 置 及 方向 相关 的 。 
如 末 在 对 接 之 前 ， 能 够 通过 某 种 途径 得 到 欲 研 究 的 配 体 、 受 体 之 间 相 互 作用 的 某 些 信息 ， 
那么 就 能 够 利用 这 些 宝贵 的 信息 来 指导 接 下 来 的 对 接 计算 。 比 如 可 以 通过 查阅 文献 获得 某 
旦 界面 残 基 的 信息 , 那么 接 下 来 , 就 可 以 在 对 接 前 调整 配 体 、 受 体 之 间 的 相对 位 置 及 方向 ， 
然后 在 对 接 时 限制 空间 搜索 的 方向 。 利 用 这 种 限制 性 的 对 接 策 略 ， 可 以 较 准 确 地 找到 正确 
的 结合 模式 。 

(1) 调整 配 体 、 受 体 之 间 的 距离 ”在 Нех 中 , 配 体 、 受 体 之 间 的 距离 是 通过 测量 配 体 、 
受 体 原点 (默认 情况 下 为 重心 ) 之 间 连 线 的 长 度 来 确定 的 。 当 这 个 长 度 大 于 ЗОА 时 ， 由 于 
算法 和 所 采用 的 势 函 数 的 原因 ，Hex 不 能 够 给 出 可 靠 的 对 接 结果 。 当 Hex 读 入 受 体 和 配 体 
之 后 ， 它 会 通过 简单 的 计算 粗略 地 猜测 出 配 体 、 受 体 可 能 的 结合 模式 。 因 此 ， 在 一 般 情况 
下 ， 配 体 、 受 体 之 间 的 距离 并 不 会 大 于 30A。 但 是 ， 当 处 理 的 受 体 、 配 体 体积 非常 巨大 的 
时 候 ， 往 往 这 个 距离 都 是 大 于 30A 的 ， 因 此 就 有 必要 通过 重新 设置 配 体 、 受 体 各 自 的 原点 
来 减 小 二 者 之 间 的 距离 。 设 置 配 体 、 受 体 原点 的 方法 如 下 。 

首先 ， 点 击 Hex 主 界面 左 侧 工具 栏 上 的 wn 按钮 以 切换 到 “原点 编辑 模式 ”(Edit 
Molecule Origins mode)， 再 点 击 右 侧 工具 栏 上 .ij 按钮 显示 当前 配 体 、 受 体 原点 间 的 连 线 。 
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然后 ， 通 过 鼠标 左 键 点 击 欲 设置 为 原点 的 位 置 ， 然 后 点 击 左 侧 工具 栏 上 的 x | 按钮 重 
新 将 鼠标 模式 切换 为 普通 模式 。 

最 后 ， 通 过 右 侧 工具 栏 的 | 按钮 显示 新 设置 的 原点 之 间 连 线 ， 可 以 发 现 ， 此 时 的 连 
线 已 经 和 最 初 的 大 不 一 样 了 。 

ЖЖ. 现在 设置 的 原点 仅仅 对 当前 的 操作 有 效 。 当 存储 编辑 过 的 配 体 或 受 体 的 结构 时 ， 
原点 信息 并 不 会 随 之 保存 。 因此, 每 一 次 用 Hex 做 对 接 之 前 都 要 检查 一 下 分 子 之 间 的 距离 。 

(2) 调整 配 体 、 受 体 之 间 的 相对 方向 “正如 上 面 提 到 的 ， 在 做 对 接 之 前 ， 往 往 希 望 能 
获得 各 种 先 验 的 信息 ， 从 而 对 接 下 来 的 分 子 对接 进 行 指导 。 当 通过 各 种 途径 获得 了 这 些 宝 、 
贵 的 信息 之 后 ， 就 可 以 通过 限制 性 对 接 降低 假 阳性 〈false positive) 的 概率 ， 从 而 更 准确 地 
获得 合理 的 对 接 模 式 。 设 置 配 体 、 受 体 相对 方向 的 方法 如 下 。 

首先 , 点 击 Hex 主 界面 左 侧 工 具 栏 上 的 乡 | 按钮 以 切换 到 所 谓 的 “方向 编辑 模式 ”(Edit 
Molecule Orientations mode)， 再 点 击 右 侧 工具 栏 上 .| 按钮 显示 当前 配 体 、 受 体 原点 间 的 
连 线 。 

然后 ， 用 鼠标 左 键 双击 配 体 或 受 体 。 此 时 ， 被 点 击 的 分 子 的 应 该 变 成 了 虚线 ， 这 说 明 
该 分 子 已 经 被 选中 。 

最 后 ， 可 以 通过 鼠标 左 键 拖 搜 选 中 的 分 子 以 改变 分 子 间 距离 (注意 ， 在 该 模式 下 并 不 
能 改变 分 子 原点 )， 也 可 以 通过 鼠标 右键 拖 搜 选中 的 分 子 以 改变 配 体 、 受 体 的 相对 方向 。 

除了 用 上 面 提 到 的 方法 设置 分 子 原点 、 距 离 及 相对 方向 以 外 ， 也 可 以 通过 Controls | 
Orientations 打开 Orientation Control 面板 《图 6-18) 对 这 些 参数 进行 нь 

(3) 对 接 在 设置 好 分 子 原点 、 分 子 间 距离 和 相 rp 
对 方向 之 后 ， 就 可 以 用 Hex 进行 对 接 了 。 在 Hex 中 ， 
对 接 中 用 到 的 所 有 参数 都 可 以 通过 Controls | Docking || oo Aus 
ШЕНІ Docking Control 面板 进行 设置 (图 6-19)。 首 || Show Molecular Origin 


先 说 一 下 Docking Control 面板 中 各 参数 的 意义 。 dh 
Steric Scan 和 Final Search: 粗糙 搜索 和 精细 搜 еніне 
索 ， 搜 索 精 度 默 认 值 分 别 为 16 和 20. Æ Hex 中 , 对 | ымы 
接 共 分 两 步 进行 。 第 一 步 为 较 粗糙 的 搜索 ， 即 Sterio | en x 
Scan， 第 二 步 为 较 精细 的 搜索 ， 即 Final Search。 当 完 | кайты | 
成 第 一 步 搜索 后 ，Hex 会 自动 放弃 那些 打分 较 差 的 结 |0 "=т= 
果 ， 只 有 剩 下 结果 才 进 入 第 二 步 计 算 。 在 Нех 5.0 rh, лы нке ji 
虽然 二 者 的 默认 精度 分 别 为 16 和 20, 1E Нех 的 设 Docking MotionfLigand x] | 


计 者 建议 使 用 的 精度 为 20/25 或 20/30。 当 受 体 或 配 体 
柔性 较 大 时 ， 建 议 使 用 20/25; 当 柔 性 较 小 时 ， 采 用 | 
20/30。 在 Hex 5.1 中 ， 经 过 大 量 的 测试 ， 这 两 步 搜索 
的 计算 精度 的 默认 值 已 经 被 调整 为 18 和 25。 因 此 对 于 | 
一 般 的 对 接 ，Hex 5.1 的 默认 搜索 精度 已 经 足够 了 。 此 | 
外 ， 若 取消 Steric Scan 复 选 框 ， 则 Steric Scan 的 精度 | 
由 Final Search 的 精度 共同 控制 。 

Correlation Туре: 对 接 类 型 ， 有 两 种 类 型 可 供 选 
择 ， 即 Shape Ошу (默认 ) 和 Shape+Electrostatics, 24 
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选择 Shape Only 时 ， 在 对 接 中 Hex 只 考虑 受 体 、 配 体 之 间 形 状 的 契合 而 不 考虑 静电 贡献 : 
当选 择 Shape+Electrostatics 时 ，Hex 会 综合 考虑 形状 和 静电 的 贡献 。 值 得 一 提 的 是 ，Hex 
并 不 提倡 在 所 有 的 对 接 中 都 采用 Shape+Electrostatics 模式 ， 因 为 Hex 中 的 原子 电荷 库 还 不 
够 完善 。 但 是 ， 对 于 蛋白 与 核酸 的 对 接 ， 由 于 核酸 分 子 带 有 强烈 的 负电 荷 ， 因 此 在 对 接 时 
必须 要 考虑 静电 的 贡献 。Hex 只 在 Final Search 时 计算 静电 贡献 。 

FFT Mode: 算法 类 型 ， 有 1D Classic Hex, 3D Fast Lite (默认 ) 及 5D Mega Memory 
三 种 模式 可 供 选 择 。 就 计算 速度 来 说 ，5D > 3D > 1D， 但 是 搜索 算法 越 复 杂 则 所 需 的 内 存 
. 越 多 ， 读 者 可 根据 自己 计算 机 的 性 能 来 选择 算法 。 

Grid Dimension: 用 于 计算 Surface skin expansion coefficient 的 格 点 大 小 , 可 选择 04— 
1.0 A。 这 个 参数 一 般 不 需要 修改 ， 选 择 默 认 的 0.6 А BIT. 

Receptor Range: ОД (rotation) 391504, PEE 0--1800, RAX 180° . 
该 角度 越 大 则 代表 在 受 体 上 的 搜索 范围 越 大 。 当 设置 Receptor Range = N° Hf, 则 受 体 可 相 
对 于 分 子 原点 间 连 线 (Intermolecular Axis) 的 旋转 角度 为 土 N2” (图 6-19)。 需 要 注意 一 
点 的 是 ， 在 对 接 中 ， 受 体 实际 上 是 不 做 任何 运动 的 。 受 体 所 有 的 运动 实际 上 都 被 转化 为 了 
配 体 的 运动 。 

Ligand Range: 配 体 旋转 搜索 范围 ， 可 选择 0 一 180”， 默 认为 180”。 该 角度 越 大 则 
代表 在 配 体 上 的 搜索 范围 越 大 。 当 设置 Ligand Range = N° 时, 则 配 体 可 相对 于 分 子 原点 间 
ЖҰҚ (Intermolecular Axis) 的 旋转 角度 为 士 W2” 《图 6-19、 图 6-20). 

А Docking Control 10 нае 
x Correlation Type [Shape Only |") 
FFT Моде [30 FastLite — "j 

Post Processing [None = Y| 
J Gria Dimension [08 т) Solutions |2000 =] | 
|  ReceptorRange 160 >] Әерзге (5 7)|| 分 子 原点 连 线 (Intermolecular Axis) 


Ligand Range [180 т Step Size |7 5 xl | r "үм 搜索 范围 (Range Angles) 
TwistRange [360 =] StepSize[55 =) |) a 
Distance Range | 40 | : 
Scan Step [0 75 т| 
52118 Fa 
С Receptor Origin) 
баа ИДУ кж 
ЖЕН Уе (Interface Residues? ‘Ligand Отіпріп ) 


图 6-19 Docking Control 面板 图 6-20 ”搜索 范围 限制 示意 图 


Twist Range， 配 体 相 对 于 受 体 的 扭转 〈twist) 搜索 范围 ， 可 选择 0 一 360*” ， 默 认为 
360° 。 该 角度 越 大 则 代表 在 配 体 可 相对 于 受 体 的 扭转 角度 越 大 。 当 设置 Twist Range = 
N° 时 , 则 说 明 配 体 可 相对 于 分 子 原点 间 连 线 (Intermolecular Axis) 的 扭转 角度 为 М? (图 
6-19、 图 6-20)。 

Step Size: 旋转 /扭转 搜索 的 步 长 ， 对 于 旋转 搜索 默认 步 长 为 7.5”， 而 对 于 扭转 搜索 
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默认 步 长 为 5.5"” 。 

Distance Range: 距离 搜索 范围 ， 可 选择 1-60 А, АУ 40 А, 44 Distance 
Range = № 时 ， 其 距离 搜索 范围 为 十 (N+1)/2 А (1 A 表示 初始 状态 )。 

Scan Step: Steric Scan 中 所 采用 的 距离 搜索 步 长 ， 默 认为 0.75 А. 

SubSteps: Final Search 中 所 采用 距离 搜索 的 步 长 权重 的 倒数 ， 默 认为 2。 当 设置 Scan 
5іер= МА, Я SubSteps = M 时 ，Final Search 中 所 采用 的 距离 搜索 步 长 为 NM А. 

Solutions: 最 终 保留 的 对 接 结果 数目 ， 默 认为 2000 个 。 

Post Processing: 对 接 后 的 处 理 ， 有 None (默认 )、Bumps+Volumes、MM Energies 
É MM Minimisation 四 种 模式 可 选 。 选 择 None 表示 在 对 接 之 后 不 做 任何 处 理 ， 选 择 
Bumps+Volumes 则 Hex 在 对 接 结束 后 会 计算 每 一 种 结合 模式 中 的 配 体 与 受 体 之 间 的 空间 
冲突 ， 即 所 谓 的 Bumps， 该 数据 可 用 于 聚 类 分 析 《〈 设 置 Clustering Control 面板 上 的 Bump 
Threshold 参数 ); 选择 ММ Energies 或 ММ Minimisation 则 在 对 接 结束 后 , Нех 会 计算 Rigid 
Body 能 (对 于 MM Energies) 或 用 分 子 力学 进行 能 量 优 化 (对 于 MM Minimisation)。 这 里 
需要 注意 的 一 点 是 ， 当 对 接 前 后 配 体 、 受 体 之 间 相对 位 置 变化 很 大 时 最 好 不 要 使 用 MM 
Energies/ Minimisation， 因 为 这 两 部 分 的 程序 还 不 完善 。 

Soln: 对 接 结果 显示 滑动 条 。 

当 设 置 好 所 有 的 对 接 参 数 后 , 可 以 点 击 Docking Control 面板 最 下 方 的 Activate # Ж 
行 对 接 , 此 时 会 弹出 一 个 对 接 进程 对 话 框 (Hex Progress) 来 显示 当前 的 对 接 进 程 (图 6-21). 
当 Нех 完成 所 有 运算 后 会 将 对 接 结果 自动 显示 在 3D 窗口 中 , 读者 可 以 利用 键盘 上 的 Page 
up/down 及 home/end 来 浏览 对 接 结果 。 在 这 里 需要 提醒 大 家 注意 的 一 点 是 ，Hex 的 聚 类 是 
在 对 接 过 程 中 完成 的 , 但 在 完成 对 接 之 后 , 如 果 用 户 修改 了 (Contorls | Clustering, 图 6-22) 
肾 类 参数 中 的 Max Cluster, Cluster Window 或 RMS Threshold, Нех 都 会 对 当前 的 对 接 结 
ЖИТ ТЭК. УК, ту Bumps Threshold, Sort Solutions by 和 Display Cluster 
并 不 会 激活 重新 聚 类 。 


НЕ руат ЕН анын жее s Tirra springi 
Max Clusters [500 M | 


Е Pop Up When Active 


: | Fourier Transform x SR FF x 
| | шараны | Display Clusters [Best +] | 
i Final Search x ClusterWindow[200 =] . 
RNS Threshold | зо — Е-- x 
Bumps Threshold| 0 D | 
Dismiss | | 

6-21 ”对接 进程 图 622 Contorls Clustering 


3. 保存 对 接 结果 
тА, заана, кыылы и сил. 
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果 的 方式 。 以 下 介绍 一 下 Hex 储存 对 接 结 果 的 方式 。 

Кесеріог: 保存 当前 3D 窗口 中 的 受 体 (PDB 格式 )。 

Ligand: 保存 当前 3D 窗口 中 的 配 体 (PDB 格式 )， 

Both: 保存 当前 3D 窗口 中 的 配 体 和 受 体 (PDB 格式 )。 

Complex: #1 Complex 文件 (PDB 格式 )。 对 应 于 用 File | Open | Complex 读 入 的 
Complex 文件 。 

Range: 保存 一 定 范围 内 的 配 体 和 受 体 (PDB 格式 )。 

Summary: 保存 对 接 结果 的 摘要 (文本 格式 )， 其 中 包含 了 能 量 、 柴 类 等 信息 。 

Matrix: 保存 配 体 的 变换 矩阵 〈 文 本 格式 )。Hex 只 能 保存 而 不 能 读 取 此 类 数据 。 该 
数据 只 能 用 于 外 部 程序 ， 可 以 通过 编写 脚本 程序 来 处 理 该 文件 ， 从 而 获得 任 一 个 配 体 构 象 
的 坐标 。 

Transform: 保存 能 量 、 配 体 转 动 和 平移 操作 的 信息 《文本 格式 )。 与 Matrix -Ж, 
Hex 不 能 读 取 该 文件 。 


三 、 对 接 实例 

以 上 介绍 了 用 Нех 做 大 分 子 - 大 分 子 对 接 的 流程 和 方法 ， 现 在 将 通过 一 个 完整 的 实例 
来 向 读者 阐述 Hex 在 实际 科研 工作 中 的 应 用 。 为 了 说 明 Hex 的 对 接 效 果 ， 选 择 Hex 自 带 
的 例子 来 进行 说 明 ， 操 作 步 骤 如 下 。 

读 入 受 体 、 配 体 及 复合 物 文 件 〈 在 /Hex 5.1/ехатріеѕ 目录 下 )， 文 件 名 分 别 为 
3hfl fv.pdb. 3hfl lypdb 和 3hfl fv lypdb。 

设置 对 接 参数 ， 将 Correlation Type 设置 为 Shape+Electrostatics, Receptor/Ligand 
Range 设置 为 45”， 其 余 参数 均 设 置 为 默认 值 。 

检查 参数 ， 确 认 无 误 后 开始 对 接 。 

待 对 接 结束 后 ，. 首 先 利 用 File | Save | Summary 来 输出 对 接 结果 的 基本 信息 (包含 
能 量 、 聚 类 及 与 参考 结构 的 RMSD). 

综合 考虑 柴 类 及 打分 挑选 出 最 好 的 结果 ， 并 与 复合 物 结构 进行 比较 。 

结果 : 挑选 出 的 最 好 的 对 接 结果 与 复合 物品 体 结构 吻合 的 相当 好 , H RMSD 只 有 
0.74A 《读者 计算 出 的 数值 可 能 会 略 有 不 同 )。 
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第 一 节 蛋白质 分 子 动力 学 模 # 


重 日 质 的 生物 功能 与 结构 动力 学 特征 紧密 相关 ， 不 同 结构 运动 模式 决定 了 蛋白 质 在 
生化 过 程 中 的 不 同 生物 功能 。 香 日 质 分 子 的 内 部 运动 和 构象 动态 的 变化 对 于 蛋白 分 子 的 正 
靖 功 能 过 程 是 非常 重要 的 ， 这 些 过 程 包括 蛋白 的 折叠 与 伸展 、 与 配 体 或 底 物 的 结合 、 催 化 
反应 、 分 子 识 别 等 过 程 。 在 这 些 不 同 过 程 中 蛋白 质 分 子 的 构象 变化 主要 是 从 精细 的 局 部 运 
动 到 整体 结构 构象 的 变化 不 等 。 要 了 解 蛋 白质 的 特性 并 找到 其 发 挥 生物 功能 的 分 子 基础 模 
型 ， 只 有 和 氨基酸 顺 序 和 三 维 结构 是 不 够 的 ， 还 必须 研究 蛋白 质 的 结构 和 功能 的 关系 、 和 蛋白 
质 之 间 相 互 作用 、 蛋 白质 和 具有 生物 活性 的 小 分 子 之 间 的 相互 作用 、 ЖИДЫ ЯР. М 
溶剂 对 蛋白 质 构 象 的 影响 、 无 机 离子 在 蛋白 质 生物 过 程 中 的 作用 等 。 

目前 ， 测 定 蛋白 质 空间 结构 的 实验 方法 如 X 射线 晶体 学 、 多 维 核磁 共振 波谱 学 技术 
等 可 以 发 现 当 蛋白 处 于 不 同 的 功能 状态 时 对 应 的 不 同 构象， 但 对 于 这 些 已 知 不 同 构象 之 间 
的 变化 路 径 的 细节 仍旧 是 不 清楚 的 。 叉 借 日 质 结构 动力 学 研究 手段 而 言 ， 目 前 还 没有 成 熟 
的 实验 技术 ， 因 此 ， 利用 计算 机 模拟 手段 研究 蛋白 质 动态 结构 与 功能 的 关系 就 显示 出 了 重 
要 性 。 随 着 分 子 生 物 学 的 发 展 和 计算 机 技术 的 长 足 进 步 ， 运 用 各 种 数学 、 物理 学 的 理论 方 
法 ， 以 计算 机 为 工具 进行 生物 学 的 基本 理论 研究 ， 尤其 是 进行 生物 大 分 子 体系 及 其 相互 作 
用 的 计算 机 分 子 模拟 研究 ， 已 经 成 为 十 分 活跃 而 且 十 分 重要 的 研究 领域 . 

计算 机 对 生物 分 子 模拟 的 结果 对 于 在 分 子 、 原 子 乃 至 电子 结构 层次 上 了 解 生 命 现象 
的 基本 过 程 具有 极为 重要 的 意义 。 给 定 一 种 生物 大 分 子 的 空间 结构 ， 使 用 分 子 动力 学 模拟 
计算 访 法 ， 可 以 模拟 得 到 分 子 系统 的 构象 和 变化 起 伏 随 着 时 间 变 化 的 各 种 信息 ， 进而 得 到 
分 子 结构 的 运动 轨迹 ,或 者 将 结构 整体 运动 分 解 为 不 同 频率 振动 模 态 的 又 加 ， 能 够 帮助 进 
一 步 理解 重 白 质 生 物 活 性 点 在 配 体 结合 、 催 化 过 程 中 的 运动 特征 。 此 外 ， 计算 机 模拟 为 天 
然 生 物 大 分 子 的 改 性 和 基于 受 体 结构 的 药物 分 子 的 设计 提供 了 重要 依据 ， 在 某 些 领域 已 成 
为 实验 研究 难以 替代 的 手段 。 在 过 去 的 10 年 中 ， 随 看 计算 机 软 硬 件 技术 的 快速 提升 ， 生 
物 大 分 子 的 计算 机 模拟 已 经 成 为 在 原子 水 平 上 研究 蛋白 质 、 核酸 等 生物 大 分 子 的 结构 和 动 
力学 性 质 的 一 个 重要 工具 。 这 种 方法 现在 已 经 大 量 用 于 研究 生物 分 子 以 及 其 复合 体 的 结 
爸 、 动 力学 和 热力 学 过 程 ， 得 到 生物 分 子 系统 的 各 种 属性 ， 包 括 蛋 白质 的 稳定 性 、 构象 变 
化 信息 、 和 蛋白 质 折 又 信息 、 分 子 识别 蛋白质、DNA、 质 膜 、 复 合体 )、 生物 系统 内 的 离 
于 运输 等 。 可 以 应 用 于 药物 设计 、X 射线 衍射 和 核磁 共振 分 子 结构 判别 等 。 

1957 Œ, Alder 和 Wainwright 首先 采用 分 子 动力 学 (MD)》 并 应 用 硬 球 模型 来 研究 凝 
案 态 系统 的 气体 和 液体 。1977 E, McCammon 等 人 在 “Nature” 上 发 表 第 一 篇 蛋白 质 的 分 
子 动力 模拟 研究 论文 ， 研究 对 象 是 当时 刚刚 解析 出 晶体 结构 的 牛 胰 岛 素 抽 制 剂 (BPT. 
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虽然 模拟 时 间 很 短 ， 但 是 使 人 们 看 到 分 子 动力 学 技术 对 研究 重 白质 分 子 功能 的 重要 作用 。 

之 后 ， 随 着 计算 机 软 硬 件 技术 的 快速 提升 ， 生 物 大 分 子 的 分 子 动力 学 模拟 已 经 成 为 在 原子 
水 平 上 研究 重 白 质 、 核 酸 等 生物 大 分 子 的 结构 和 动力 学 性 质 的 一 个 重要 工具 。 随 着 分 子 模 
拟 技 术 的 飞速 发 展 ， 逐 步 形成 了 一 些 较 完善 的 软件 。 应 用 于 生物 大 分 子 领域 的 分 子 模拟 软 
件 主要 有 美国 Accelrys 公司 的 Discovery Studio 〈 即 原来 的 msightI) 软件 包 以 及 Tripos 公 
司 的 Sybyl 软件 ， 此外， 还 有 一 些 用 于 学 术 研 究 的 模拟 软件 ， 如 NAMD、GROMACS 等 。 
以 下 将 介绍 Discovery Studio 软件 包 中 的 分 子 动力 学 工具 以 及 广泛 使 用 的 NAMD、 

GROMACS 软件 。 
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本 节 将 以 一 个 组 蛋白- 配 体 复 合 物 将 进行 带 束 缚 动力 学 模拟 为 实例 介绍 Discovery 
Studio 中 分 子 动力 学 工具 的 详细 操作 ,Discovery Studio 中 的 分 子 动力 学 采用 的 是 CHARMm 
程序 ， 主 要 过 程 包括 : 钙 准 备 量 白 - 配 体 复合 物 ， 四 选择 并 定义 原子 组 ; @ 添 加 溶剂 体系 ， 
由 设置 和 删除 束缚 部 分 ， 怨 进行 带 束 缚 的 分 子 动力 学 模拟 ;人 @@ 分 析 动 力学 模拟 轨迹 ;人 @ 计 
算 香 白 - 配 体 相互 作用 能 量 。 


一 、 准 备 分 子 动力 学 体系 ， 执 行 分 子 动力 学 计算 
1. 号 入 重 日 - 配 体 复合 物 ， 并 赋予 力 场 参数 
双击 图 标 ， 启 动 Discovery Studio， 在 文件 浏览 器 (Files Explorer) 找到 1IE9 VDX.dsv 
文件 ， 双 击 打 开 ， 将 蛋白 - 配 体 复 合 物 导 入 3D 窗口 (图 7-1) 。 
(спе - Molecula йай» x pii р н ы аш амын aB 


IÉ [v] z, complex | 


ж [F] Z° Protein Groups 
Hetatm 


= L on's "п sm mm пш sm n ш ш 


图 7-1 复合 物 示 意图 


在 工具 〈Tools) 窗口 中 ， 鼠 标点 击 窗口 最 上 方 列表 框 的 下 拉 和 箭头， 选择 Simulation, 
在 工具 窗口 中 展示 分 子 动力 学 模拟 工具 面板 组 。 
从 工具 面板 组 中 找到 Simulate Structures | Forcefield 工具 面板 ， 确 保 当 前 力 场 为 缺 省 的 
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CHARMm 力 场 ， 否 则 可 通过 Choose forcefield 命令 选择 CHARMm 力 场 ,然后 点 击 Apply 
Forcefield 命令 ， 给 蛋白 - 配 体 复合 物 赋 力 场 (图 7-2). 


Imulata Structures E EEE EA рит x] 


НЫЛ а ы 22. 
f Forcefield: CHARNm ~ 

| Partial Charge: Мотапу-Копе ~ 

| Арріу Forcefield 

Clear Forcefield 


Forcefield Status —— n. 
complex typed with CHARMm 


| More... 


图 7.2” 赋 与 复合 物力 场 参 数 


2. 添加 溶剂 环境 

为 使 动力 学 模拟 过 程 更 接近 真实 情况 ， 可 模拟 人 体内 环境 添加 溶剂 环境 。 

流程 中 ， 点 击 “+” 号 展开 Simulations 文件 夹 ， 双 击 Solvation 流程 ， 该 流程 在 参数 中 
打开 ，1IE9 VDX:complex 自动 载 入 到 Input Typed Molecule 参数 格 。 

展开 Solvation Model 选项 ， 设 置 Solvation Model 选项 为 Explicit Periodic Boundary。 
这 一 操作 设置 添加 周期 性 边界 溶剂 模型 。 设 置 Cell Shape 选项 为 Orthorhombic， 此 操作 设 
置 添加 的 溶剂 盒子 为 长 方 体形 状 。 

设置 Add Counterion 为 True, ÆJ Ада Counterion 选项 选择 Salt 溶液 类 型 。Salt 
Concentration KAWA 0.145， 阳 离子 类 型 (Cation Type) 设置 为 Sodium， 阴 离子 类 型 
(Anion Type) 设置 为 Chloride， ТУОМ EN (图 7-3) 。 


Solvation X БҮ 
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Center of Bass ТЕУШІ complens = 
Minimum Distance Fron Boun 7.0 0 
ӘП Shape orthorhmbie 
= Аға 4 Counterion 286 True 
Salt Concentrati оп 10. 145 и 
_ Rendon Seed | 314158 БОКУ й 
— “е А т. РТ à 
Г” с “aa Е a 


图 7-3 Solvation 参数 设置 


ETRE H AE 按钮 开始 添加 溶剂 ， 这 个 作业 需要 数 分 钟 完 成 。 
FERA PAE Window | Close АП 关闭 所 有 窗口 。 
当 任 务 完成 对 话 框 打开 , 点 击 OK 关闭 。 双 击 该 作业 行 打开 Output 文件 夹 和 Reporthtm 
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ЖЇР» кїт complex.dsy 文件 ， 查 看 添加 溶剂 环境 结果 《图 7-4) 。 

3. 选择 束缚 的 氨基 酸 残 基 

由 于 添加 溶剂 时 ， 水 分 子 和 离子 都 是 规则 排列 ， 此 实例 中 ， 在 进行 动力 学 时 首先 束缚 
住 蛋 白 - 配 体 复合 物体 系 ， 仅 优化 一 下 水 分 子 和 离子 ， 所 以 需要 设 署 束缚 体系 。 

系统 视图 中 点 击 选中 受 体 分 子 Receptor， 按 住 Shift 键 同 时 选择 配 体 分 子 VDX， 下 拉 
菜单 中 选择 Edit | Group... 命 令 ,在 Group 对 话 框 中 输入 Group 的 名 字 “Fixed”, 点 击 Defined 
EXET. Amh 3D 窗口 任意 空白 处 取消 选择 。 新 定义 的 组 将 出 现在 系统 视图 中 (图 7-5) 。 


| complex ~ Molecule Window X | 
ir ara =: ЕНЕР мане 
| | 144 ProteirSequence 
* |М| 29 Receptor 
+ [vs vD 
+ Ж Protein Groups 
[7] 6% Hetatm 


+: Ж СНАЕМт Groups 


ы |мі-зЧ 
+ а-ә CLA 
| ага 50 
! 
7-4 ЛТА 图 7-5 设置 束缚 体系 


4. 设置 束缚 

此 实例 中 ， 欲 先 仅仅 优化 一 下 水 分 子 及 离子 ， 因 此 ， 必 须 束缚 体系 中 其 他 的 原子 。 

在 系统 视图 中 ， 点 击 选择 Fixed 组 ， 工 具 中 打开 Simulation | Simulate Structures 下 
Constraints 工具 面板 ， 点 击 Create Fixed Atom Constraint， 点 击 3D 窗口 任意 空白 处 取消 选 
择 。3D 窗口 中 可 以 看 到 被 束缚 的 原子 周围 环绕 着 蓝 色 的 小 槛 〈 图 7-6) 。 


图 7-6 束缚 体系 示意 图 
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5， 打 开动 力学 流程 ， 修 改 参 数 

确保 添加 了 溶剂 体系 的 complex.dsv 窗口 为 当前 活跃 窗口， 文件 中 双击 Simulations > 
件 夹 下 Standard Dynamics Cascade 流程 ， 该 流程 在 参数 中 打开 ， complex:complex 自动 载 入 
到 Input Typed Molecule 参数 格 。Standard Dynamics Cascade 流程 包括 5 个 阶段 ， 优化 1 
(Minimization), Е П СМіпішігабоп2), 219% (Heating)、 平 衡 (Equilibration)、 动 力学 
(Production)。 展 开 Minimization 阶 段 的 参数 组 , 确保 Constraints 选项 选择 Fixed:fix 1 Fixed, 
确保 其 他 阶段 中 Constraints 选项 为 空白 。 

展开 Prodution 阶段 参数 组 , 设置 Steps 为 5000, 步 长 Time Step 为 0.002, Save Results 
Frequency 27 100, Туре 为 МРТ (| 7-7). 


Standard ісі Cascade > 
| saah, 
|. Тары Typed Шс] асе Е хар] ах: complex : 
ji Minimization | i 
x Algorithm Steepest Descent | 

Шах Steps 500 

BMS Gradient 0.1 
Energy Change 0,0 | : 
- Constraints Fixed: fix | Fixed | 
L Pb Minimiration2 I | 
1 Equilibration Е I Е | 
сш Production | 
| Steps S000 z! 
j Тізе Step 0.002 
| _ Така Temperature 300. 0 i 
|; aptr pari ласы Mon = a i 
| Save Results Frequency Е 100 | 
! Seve Restart File Falze i 
Í Constraints 0 — | i 
| Туре ЕРІ | 
E 2... 23и е ос | 
Е E Implicit Solvent Hodel Mone i 
|E Nonbond List Radius | 140 | 
ӨН Electrostatics | Farticle Megh Ewald | | 
18 hdvaneed s салыы о 2 2 | 
Í Dynamics Integrator Leapfrog Verlet _ Е I | | Е 
„Apply SHAKE Constraint True | l 22 | 
Random Humber Seed 314159 | 
Mumber of Processors 1 


图 7-7 Standard Dynamics Cascade 流程 参数 设置 


ЖЕЙ Implicit Solvent Modeler 选项 为 None, Electrostatics 选项 选择 Particle Mesh Ewald. 

在 工具 栏 中 点 击 革 按钮 开始 分 子 动力 学 计算 。 这 个 作业 需要 数 分 钟 完 成 ， 作 业 的 状 
态 可 以 在 Jobs FER., 

当 任务 完成 对 话 框 打开 ， 点 击 OK 关闭 。 

6. 得 看 结果 ， 显 示 构 象 变化 动画 

双击 该 作业 行 打开 Output 文件 夹 和 Reporthtm 文件 。 点 击 打开 complex nowater.dsv 
文件 ， 按 Сені 最 大 化 观测 区 域 ， 在 系统 视图 中 选择 Fixed:fix 1 _ Fixed， 单 击 鼠 标 右键 ， 
在 右键 菜单 中 选择 Hide， 隐 藏 每 个 原子 周围 的 蓝 色 小 槛 。 

确保 3D 窗口 是 当前 活跃 窗口 ,选择 下 拉 菜 单 Structure | Animation | Play 命令 ， 则 可 以 
看 到 在 3D 窗口 中 的 复合 物 开始 运动 ， 显 示 动 力 学 模拟 过 程 中 的 变化 ,动画 循环 往复 播放 。 
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再 次 选择 下 拉 菜 单 Structure | Animation | Play 命令 可 以 停止 动画 播放 。 


二 、 分 析 分 子 动力 学 计算 结果 

1. empe m р 25 

在 工具 窗口 中 ， 鼠 标点 击 窗口 最 上 方 列表 框 的 下 拉 箭 头 ， 选 择 Simulations 
览 器 窗口 中 展示 Simulations 工具 面板 组 。 打开 Analyze Trajectory 工具 面板 组 , 选择 Create 
Plot... 命 令 , 打开 Choose X and Y Axes 对 话 框 , 设置 Graph Туре 为 Line, 左 侧 的 Choose X 
Axis 栏 里 选择 Step, AMAI Choose Y Axis/Axes 栏 里 选择 Potential Energy, кї OK 按钮 。 
将 会 在 新 窗口 中 打开 能 量 -时 间 关 系 曲线 。 该 曲线 只 显示 了 动力 

在 曲线 图 示 区 域 点 击 鼠 标 右键 ， 选 择 右键 菜单 中 Display Style... 命 令 ， 点 击 Аф 
键 ， 在 面板 的 底部 选择 Show points on line， 点 击 OK (El 

БОЛЫН А Е, 可 以 显 

2. 计算 相互 作用 能 

采用 动力 学 计算 所 得 的 轨迹 , 可 以 计 
算 复合 物体 系 中 任意 一 组 原子 间 的 相互 
作用 能 。 此 实例 中 ， 以 计算 蛋白- 配 体 之 
间 的 相互 作用 能 为 例 。 

确保 Complex nowaterdsv 窗口 为 当 
_ | кн 前 活路 窗口， 在 流程 中 展开 Simulation Ж 
500 4000 500 600 700 800 үҙ, ЖІ: Calculate Interaction Energy й 

程 ， Sm 复合 物 名 称 


学 阶段 (Production Phase) 


ced 


47-5 ”能量 曲线 示意 图 
Molecule 参数 格 ， 另 外 两 个 参数 选项 显示 Т 2 

在 系统 视图 中 选择 VDX， 然 后 在 参数 中 点 击 Atom Selection 1 参数 ， кескіндер 
Create New Group from selection... 条 目 ， 则 在 参数 栏 中 出 现 Group 项 目 。 此 操作 表示 选择 
配 体 作为 第 1 个 组 。 

在 系统 视图 中 选择 Receptor， 在 参数 中 点 击 Atom Selection 2 参数 ， 点 击 下 拉 列 表 中 
Create New Group from selection... 条 目 ， 则 在 参数 栏 中 出 现 Group 项 目 。 此 操作 表示 选择 
整个 蛋白 作为 第 2 个 组 (图 7-9)。 

保持 Calculate Interaction Energy 流程 中 其 他 参数 为 缺 省 设置 ， 在 工具 栏 中 反击 岁 按 
钮 开始 计算 ， 此 作业 将 会 计算 动力 学 轨迹 中 所 有 构象 中 的 和 蛋白- 配 体 间 的 相互 作用 能 。 

3. 打开 相互 作用 能 计算 结果 

当 任 务 完成 对 话 框 打 开 , 点 击 OK 关闭 。 双 击 该 作业 行 打开 Output 文件 夹 和 Report.htr 
文件 。 点 击 complex.dsv 文件 ，Ctrl+T 打开 表格 浏览 器 (Data Table)， 选 择 Conformation 
键 显示 每 个 构象 单独 的 数据 ， 拖 动 表 格 找到 四 个 新 增 栏 ; ID、INTERACTION ENERGY. 
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ELECTROSTATIC INTERACTION ENERGY № VDW INTERACTION ENERGY. 


лот Sde 1 

| htom Selection 2 О 
| 直入 ЫШ | 
Ta Dielectric Model 

|В nd List Radius | 
| 


图 7-9 Calculate Interaction Energy 流程 参数 设置 


以 上 栏目 中 显示 了 所 选 定 的 两 个 原子 组 〈 在 此 实例 中 为 蛋白 - 配 体 ) 间 的 非 键 作 用 能 
量 及 其 各 组 分 的 数值 。 

4， 绘 制 相 互 作用 能 曲线 

采用 表格 中 的 数据 ， 可 以 绘制 数据 曲线 。 

ARETE FE Chart | Line Plot 命令 ， 打 开 Choose Plot Axes 对 话 框 ， 对 话 框 左 侧 
的 Choose X Axis 中 选择 Step， 对 话 框 右 侧 的 Choose Y Axis/Axes 中 选择 INTERACTION 
ENERGY, FE Ctrl 键 连 续 选 择 ELECTROSTATIC INTERACTION ENERGY 及 VDW 
INTERACTION ENERGY， 点 击 OK (M 7-10). | 


ENERGY,VDW INTERACTION ENERGY 


3000 4000 5000 6000 7000 8000 
Step 


ELECTROSTATIC INTERACTION ENERGYINTERACTION 


图 7-0 ”相互 作用 能 曲线 示意 图 


三 条 能 量 曲线 图 将 在 新 窗口 中 打开 ， 这 是 检验 相互 作用 能 的 重要 性 质 。 较 低 的 相互 作 
用 能 预示 了 合理 的 结合 构象 。 从 能 量 曲线 图 中 ， 也 可 以 清楚 地 看 到 每 一 步 或 每 一 个 构象 的 
范 德 华 和 静电 能 量 的 分 布 。 

5， 保 存 最 低能 量 构象 

症 以 选择 保存 动 力学 轨迹 中 任意 构象 以 备 进 一 步 分 析 使 用 。 
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ТЕ complex — Line Plot 窗口 中 选择 最 低能 量 构象 ,激活 3D 窗口 ， 打 开 系 统 视图 ， 将 选 
中 的 高 党 的 构象 显示 出 来 ， 点 击 选择 下 拉 菜 单 Edit | Сору 命令 ， 点 击 选择 下 拉 菜 单 File | 
New | 3D Window 命令 ， 打 开 一 新 的 3D 窗口 ， 在 新 窗口 中 选择 下 拉 菜 单 Edit | Paste 命令 。 
则 选中 的 构象 出 现在 新 的 3D 窗口 中 ， 可 以 用 于 下 一 步 研究 和 分 析 。 

б. 定义 二 面 角 监控 

їн зр 窗口 ， 打 开 系 统 视图 查看 轨迹 文件 ， 按 住 Ctrl 键 选 择 配 体 VDX 中 的 四 个 原 
Т: C23、C24、C25、C27， 点 击 选择 下 拉 菜 单 Structure | Monitor | Torsion 命令 。 

绿色 的 二 面 角 监控 将 呈现 在 图 形 界 面 里 , 同时 可 以 看 到 系统 视图 (Hierarchy View) 及 
表格 下 的 TorsionMonitor 里 也 会 出 现 监 控 信 息 。 当 播放 动画 时 ， 二 面 角 也 会 随 构 象 变化 而 
改变 (图 7-11). 

7， 定 义 距 离 监控 | 

在 系统 视图 (Hierarchy View) 中 选择 配 体 VDX 中 的 O3 以 及 蛋白 受 体 的 His397 氨基 
酸 残 基 的 NE2 原子 ， 点 击 选 择 下 拉 菜 单 Structure | Monitor | Distance 命令 。 绿 色 的 距离 监 
控 将 呈现 在 图 形 界面 里 的 两 个 原子 之 间 (图 7-12). 


图 7-11 二 面 角 监 控 示 意图 图 7-12 距离 监控 示意 图 


8， 开 局 气 键 监控 | 

AAFF FKEA Structure | Monitor | HBond 命令 。 结 构 中 的 所 有 氧 键 都 将 以 绿色 虚 
线 的 形式 显示 出 来 ， 当 播放 动画 时 ， 二 面 角 也 会 随 构象 变化 而 改变 〈 图 7-13). 

为 外 ，Intermolecular HBonds 命令 将 仅 显 示 独 立 的 分 子 间 的 氨 键 。 由 于 此 实例 中 仅 包 
合 一 个 复合 物 分 子 ， 故 在 此 选择 HBond ўт. 

9， 建 立 RMSD 对 比 关 系 ， 编 译 动力 学 轨迹 监控 数据 

在 流程 中 展开 Simulation， 双 击 Analyze Trajectory 流程 ， 该 流程 在 参数 中 打开 ， 复 合 
物 名 称 complex:complex 自动 载 入 到 Input Molecule 参数 格 。 

A Properties 参数 ， 勾 选 Torsion1、Distancel 以 及 HBond Monitorl 。 

凡 击 RMSD Reference 参数 ， 下 拉 列 表 中 选择 1 作为 参考 。 
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图 7-13 ” 氢 键 监控 示意 图 


展开 RMSD Reference 参数 组 ， 确 保 Scope 参数 设置 为 Molecule， 此 操作 确定 计算 的 


是 每 个 分 子 的 RMSD 数值 。 
设置 Atom Group 及 Atom Group to Fit 参数 为 Backbone (图 7-14)。 


| Kknalyre Trajectory Х | n 
| Parameter Tini Parameter Value 0 

| Input Molecule complex; complex | | 
| Properties Torsionl,Distarcel, HBond Moni torl | 
|E Torsion Angle Properties | 
Іш RMSD Reference 1 | 
| Scope Molecule | 
| Label EMSD to con | 
| htom Group Backbone | 
| htom Group to Fit Backbone ; 
| Save Fitted Trajectory | True | 
É kdvanced ! 


图 7-14 Analyze Trajectory 流程 参数 设置 


在 工具 栏 中 点 击 苏 按钮 开始 计算 。 点 击 选择 下 拉 菜 单 Window | Close АП 命令 ， 如 果 
询问 是 否 保 存 文件 ， 选 择 No。 当 任务 完成 对 话 框 打开 ， 点 击 OK 关闭 。 双 击 该 作业 行 打 
JF Output 文件 夹 和 Reporthtm 文件 。 点 击 打 开 complex.dsv 文件 。 

10. 绘制 监控 数据 曲线 

绘图 之 前 ， 确 定 表格 中 包含 所 需 数据 。 

激活 Complex 3D 窗口 ， 在 工具 浏览 器 中 选择 Simulation 工具 面板 ， 打 开 Analyze 
Trajectory 工具 面板 ， 点击 Create Plot… 命 令 。 在 Create Plot… 对 话 框 中 , 确定 设置 Plot type 
为 Line, 设置 左 侧 的 Choose X axis 栏 为 Time， 右 侧 的 Choose Y axis/axes 中 选择 Torsionl 。 
点 击 OK 关闭 对 话 框 。 二 面 角 曲线 将 在 新 窗口 中 生成 〈 图 7-15)。 

Analyze Trajectory 工具 面板 中 ， 点 击 Create Plot… 命 令 。 在 Create Plot… 对 话 框 中 ， 确 
定 设置 Plot type 为 Line， 设 置 左 侧 的 Choose X axis 栏 为 Time， 右 侧 的 Choose Y axis/axes 
中 选择 Distancel。 点 击 OK 关闭 对 话 框 。 距 离 曲 线 将 在 新 窗口 中 生成 (图 7-16)。 
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图 7-15 二 面 角 监控 曲线 示意 图 


2 
. 绘制 氨 键 热 图 
激活 Complex 3D 窗口 ， 打 开 表 格 ， 选 择 Conformation 标签 ， 滚动 表格 至 氧 键 监控 数 


据 ，HBond Monitorl 纵 栏 中 显示 了 该 构象 中 找到 的 气 键 总 数 。 
氮 击 选择 下 拉 菜 单 Chart | Heat Мар 命令 ， 氢 键 热 图 将 在 新 窗口 中 打开 ， 此 图 显示 了 


选择 标 有 纵 栏 ， 按 住 Shift 键 选择 氨 键 最 后 一 纵 栏 ， 此 操作 选择 了 除 HBond Monitor] 
动力 学 过 程 中 复合 物体 系 中 的 氨 键 情况 〈 图 7-17)。 


外 ， 所 有 气 键 相关 栏目 。 
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ЁН 7-17 氧 键 热 图 示意 图 
在 Create Plot… 对 话 框 中 ,确定 设置 Plot type 为 Line, 设置 左 侧 的 Choose X axis № 
Time, ÜB Choose Y axis/axes 中 选择 IRMSD to conf 1。 点 击 OK 关闭 对 话 框 。RMSD 


#0089 Complex 3D 窗口 ， 在 工具 浏览 器 中 选择 Simulation 工具 面板 ， 打 开 Analyze 
曲线 将 在 新 窗口 中 生成 (M 7-18). 


12. 绘制 RMSD 曲线 
Trajectory LAHIR, it Create Plot… 命 令 。 
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7-18 RMSD 曲线 示意 图 


第 三 节 利用 NAMD 进行 分 子 动力 学 计算 


一 、NAMD 简介 
NAMD 是 一 款 由 美国 伊利 诺 伊 大 学 厄 本 纳 -香槟 分 校 《University of Minois at 
Urbana-Champaign, UIUC ) 贝克 曼 研 究 所 理论 生物 物理 小 组 开发 的 优秀 的 分 子 动力 学 软 
件 。 它 计算 速度 快 ， 运 行 效率 高 ， 能 在 多 种 软 硬 件 平台 下 运行 ， 同 多 种 分 子 动力 学 软件 和 
力 场 兼 容 。 且 使 用 简便 ， 用 户 群 大 ， 广 泛 用 于 科研 和 生产 之 中 。NAMD 本 身 只 能 完成 动 
力学 计算 功能 ， 建 模 和 数据 处 理 要 在 其 他 软件 中 进行， 这 些 辅助 软件 中 最 重要 的 是 VMD。 
VMD NN А, 建 模 、 数 据 处 理 等 多 种 功能 。 它 同 NAMD 系 出 同门 ， 已 实 
颖 链接 。NAMD 和 VMD 还 提供 了 一 个 TCL (tool command language) 
EAMT, T 可 以 通过 TCL 编程 实现 若干 功能 而 不 需要 阅读 和 修改 程序 的 源 代码 。 NAMD 
N CHA 容 性 最 好 , 而 这 个 力 场 主要 是 针对 核酸 ,蛋白质 和 脂 类 。 同时 VN 
大 部 分 功能 也 主要 是 针对 生物 体系 。 鉴于 这 些 方面 的 限制 , NAMD 目前 多 被 用 来 模拟 生物 
体系 。 对 于 非 生物 体系 的 研究 如 碳 纳米 管 、SiO; 等 也 有 报道 。 NAMD 和 VMD 的 下 载 地 址 

eduyResearchnamd #lhttp://www.ks.uiuc.edu/Research/vmd/. 


二 、NAMD 程序 的 安装 与 使 用 

VMD 和 NAMD 同时 提供 源 代 码 版 本 和 多 种 平台 下 的 预 编译 版 本 , 用 户 可 以 根据 需要 
选择 安装 。 预 编译 版 安装 方便 ， 且 使 用 了 大 量 的 优化 选项 进行 了 编译 ， 运 算 速度 较 快 ， 如 
果 没 有 特殊 要 求 可 以 安装 这 种 。 当 机 器 平台 不 在 预 编译 版 本 的 支持 之 ， 或 是 通过 删改 源 
代码 的 方式 增加 或 改进 程序 的 功能 时 ， 就 必须 E | 

1， 安 装 方法 

以 下 介绍 VMD 和 NAMD 的 预 编译 版 本 的 安装 过 程 。 所 有 演示 都 是 在 RedHat 
Enterprise Linux 5 和 Microsoft® Windows® xp 下 完成 ，Linux 的 shell 为 bash 3.1。 

LINUX F, ЕН VMD 安装 文件 后 进入 ， 输 入 /configure Linux, FREA src Н, 
输入 make install， 如 果 出 现 ”VMD installation complete. Enjoy!” З/Ж, 说 明 VMD 安 
装 完成 。 程序 文件 默认 安装 到 /hsr/local/bin 目录 ， 所 以 这 个 操作 需要 root 权限 。 修 改 
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configure 文件 更 改 安装 路 径 后 ， 可 以 以 普通 用 户 权 限 安装 。NAMD 为 tar.gz 压缩 文件 ， 解 
压 后 无 须 安 装 即 可 使 用 。 

Windows 下 ， 双 击 VMD 安装 文件 即 可 完成 安装 ， 上 默认 安装 路 径 为 CAProgram 
Files\University of Hlinois\VMD， 启 动 快 捷 方 式 可 以 在 开始 菜单 中 找到 。NAMD 为 zip Ей 
文件 ， 解 压 后 无 须 安装 即 可 使 用 ， 比 如 可 以 解压 后 放 到 C:\Program Files\University of 
IllinoisNAMD 目录 中 。 

安装 包 内 有 如 下 几 个 重要 文件 : 

charmd, charmrun: charm++ 的 守护 和 调用 程序 ,用 以 在 并 行 环境 中 使 用 NAMD。 

namd2: 为 пата 的 主 程序 ， 除 完成 动力 学 计算 的 功能 外 ， 还 负责 进行 消息 传递 和 任务 
分 发 等 。 

psfgen: psf 文件 的 生成 程序 ， 用 于 体系 建 模 。 

flipbinpdb, бірісі 二 进 制 轨迹 文件 在 big-endian 和 small-endian 机 器 之 间 转 换 。 

还 有 一 些 很 有 用 的 文件 没有 随 软 件 包 一 起 发 布 ， 如 catdcd 等 它 可 以 很 方便 编辑 轨迹 
ылык 这 些 可 以 到 http://www.ks.uiuc.edu/Research/vmd/plugins/ 人 下载。 

VMD 在 某 些 Linux 发 行 版 下 因为 系 统 库 依赖 关系 无 法 正常 使 用 ， 最 常见 的 问题 是 缺 
j ibstdett.0.5, 表现 为 程序 启动 后 立即 退出 ， Аит ETERA 
о A 


源 代码 编 译 过 程 较 为 复杂 ， 可 以 参考 随 代 码 一 起 发 行 的 notes.txt КУК. 

2， 使 用 方式 

МАМ” 在 一 个 计算 核心 上 的 使 用 方法 很 简单 ， 只 需要 准备 好 一 个 配置 文件 ,然后 运行 

namd2 <configure file> 即 可 。 

VMD 是 一 个 分 子 动力 学 视图 和 数据 分 析 的 软件 ， 有 多 种 使 用 方式 。 

(1) 图 形 界面 ”在 控制 台 下 输入 VMD， 可 以 以 图 形 界面 方式 启动 VMD。 局 动 后 包 
含 3 个 窗口 〈 见 图 7-19): main AO (CEE), console 窗口 (EF) 和 display 窗口 СА)» 
main 窗口 中 有 大 量 的 菜单 和 按钮 ， 用 于 进行 基于 图 形 界面 的 常用 操作 console 窗口 用 于 
VMD 的 命令 行 操 作 ， 也 用 于 输出 信息 ，display 窗口 用 于 显示 分 子 结构 。 

(2) 命令 行 交 互 模式 VMD ARA tcl, 在 tcl 命令 行 模 式 下 VMD 可 以 实现 大 量 而 灵 
活 的 功能 。 有 些 功 能 不 在 main 窗口 的 菜单 中 ， 只 能 在 这 种 模式 下 进行 。 命 令 行 操作 可 以 
在 console 窗口 中 进行 ， 也 可 以 打开 Extensions | TkConsole, A3) tk 终端 (左下)。 后 者 有 
自动 补 全 、 语 法 高 亮 等 功能 ， 使 用 起 来 很 方便 。 如 果 用 vmd -dispdev text 则 可 以 以 文 
本 方式 启动 VMD， 只 会 出 现 console 窗口 ， 可 以 用 于 远程 登录 时 候 使 用 。 

(3) 脚本 模式 ”把 在 交互 模式 下 的 命令 按 顺序 写 入 一 个 文件 中 ，VMD 可 以 以 脚本 方 
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式 运行 此 文件 。 使 用 流程 控制 语句 可 以 实现 更 强大 的 功能 。 启 动 方式 为 vmd -dispdev 
text -е <script е Е жн text < <script file>. 


VMD i.f. 7betas OpenGL Display 


In fo 1 opent renderer: Mesa GLX Indirect 
res: STENCIL када HTA МРОТ РР PS 
s lurasa: 2.0 [(20848x286481), Multitextu 


Main console splay active (Tc18.5.6 / TKB.5.6) | 
《pre cti 1 % 


| aa Toa x 
Шеге БЕС ж 


(8 7-9 VMD 程序 界面 


三 、 构 建 模型 

以 短 杆菌 肽 A (gramicidin А, GA) 为 例 ， 介 绍 使 用 NAMD 进行 分 子 动力 学 模拟 的 步 
E, GA 是 由 2 个 包含 15 个 氨基 酸 残 基 的 肽 链 形成 的 管状 二 聚 体 ， 在 细胞 膜 中 作为 传输 
水 和 Na, K'E. GA 单 聚 体 序列 为 VGALAVVVWLWLWLW， 其 中 带 下 划 线 的 表 
示 D- 氨 基 酸 残 基 ，N 端 由 甲 酰基 (FOR) 封 端 ，C 端 由 乙醇 氨基 (ЕТА) Hm. BAPE 
管状 结构 ， 管 长 24A， 内 径 4 一 5A， 分 子 结构 如 图 7-19 所 示 。 因 其 结构 和 功能 简单 ， 在 确 
定 其 结构 之 后 就 作为 分 子 动力 学 模拟 的 热门 分 子 。 

但 当 进 行 分 子 建 模 时 ， 因 为 其 中 包含 多 条 肽 链 、D- 氨 基 酸 残 基 和 不 常见 的 链 噶 封 新 基 
团 ， 并 且 要 为 该 蛋白 质 建立 一 个 膜 环 境 ， 这 个 例子 涉及 的 问题 是 比较 多 的 。 

1. 获取 GA 的 结构 文件 

这 可 以 从 pdb 蛋白 质 结 构 数 据 库 〈 http:/Avww.rcsb.org ) 下 载 ，pdb 号 为 UNO. 

2. 查看 分 子 结构 

以 图 形 界面 方式 启动 YMD，File | New Molecule | Browse， 选 择 pdb 文件 | Load, Ж 
入 分 子 〈 在 VMD 中 ， 称 存储 在 一 个 文件 中 的 体系 为 一 个 分 子 )， 可 以 在 display 窗口 中 得 
看 分 子 结构 。 打 开 菜 单 Graphics | Representation | Drawing style | Drawing Methods， 可 以 选 
择 多 种 视图 模式 查看 。VMD 可 以 同时 载 入 多 个 分 子 〈 文 件 )， 在 main 窗口 中 间 的 框 中 为 
载 入 分 子 的 列表 。 每 行 最 前 面 一 列 为 文件 的 编号 。 这 个 编号 从 0 开始 ， 每 个 分 子 唯 一 ， 人 必 
为 它 的 标识 。 
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3， 分 割 文件 

打开 TkConsole 窗口 ， 输 入 如 下 命令 把 GA 分 子 的 每 条 链 分 别 存 为 1 个 文件 ， 并 略 去 
其 中 所 有 H 原子 。 

set chainA [atomselect 0 “ chain A and noh ”] 

set chainB [atomselect 0 “ chain В and noh ”] 

$chainA writepdb chainA.pdb 

$chainB writepdb chainB.pdb 
o 在 用 таран 每 个 et Ор ЕНЕ: Б 


4， 建 立 适 合 GA 的 力 场 文件 

МАМО 兼容 多 种 力 场 ， 使 用 最 多 的 是 CHARMm 力 场 。 力 场 文件 可 以 到 
http:WmackerellLumaryland.eduCHARMm ff params.html 处 下 载 。 首先 使 用 top all27 prot 
lipid.inp 构建 GA 分 子 的 psf 文件 。 但 由 于 这 个 文件 中 并 不 包含 2 个 封 端 基 团 ， 需 要 适当 
修改 。 

D 寻找 其 中 “DEFA FIRS NTER LAST.CTER” 一 行 ， 注 释 掉 。 

© 下 列 内 容 为 自 定 义 的 2 个 封 疹 基 团 的 结构 信息 ， 包 括 原 子 在 力 场 中 的 类 型 、 电 和 荷 
以 及 为 补 全 没有 坐标 的 原子 而 加 的 内 坐标 信息 。 这 些 内 容 在 文件 最 末 END 标记 之 前 加 入 。 

RESIFOR 0.00 

GROUP 

ATOM HA HA .0900 | 

ATOM C C 4200 ! 

ATOM O O -.5100 ! 

BOND C HA C +N 

DOUBLE O C 

IMPR CHA +N O 

IMPRC+N HA O 


RESI ETA 0.00 ! ethanolamine in peptide chain 
GROUP ! 
GROUP 

АТОМЫ NH -047 ! 

АТОМНМ H 031 ! 

АТОМСА СТ2 -002 ! 

ATOM HA1 НА 0.09 ! 

ATOM HA2 HA 0.09 ! НАІ-СА-НА2 
GROUP ! 

АТОМ СВ С(СТ2 005 ! 

АТОМ HB1 HA 009 ! 


ATOMHB2 HA 009 ! | 

ATOMOG OHI -066 ! ОС--НСІ 

АТОМ НСІ H 0.43 ! 

BOND N HN N CA 

BOND СА НА! CA HA2 СА СВ 

BOND CB HB1 CB HB2 CB OG 

BOND OG HG1 

IMPR N -C CA HN 

ІСС СА * HN 1.3474 12437 180.00 11418 0.9999 
ICN СА CB OG 1.5084 107.86 48.44 104.92 1.3987 
ICCA CB OG НСІ 15191 104.92 173.19 111.99 0.9495 
ICHN N СА СВ 10145 10835 -49.03 10786 1.5191 
ICN СВ *CA HAI 00000 000.00 120.00 000.00 0.0000 
ICN СВ *CA НА2 0.0000 000.00 -120.00 000.00 0.0000 
ICOG СА *CB HBI 0.0000 000.00 120.00 000.00 0.0000 
ICOG СА %СВ HB2 .0.0000 00000 -120.00 000.00 0.0000 


top 文件 是 CHARMm 力 场 的 内 容 之 一 ， 在 其 中 定义 了 氨基 酸 残 基 和 脂 分 子 中 各 个 原 
子 的 类 型 、 电 荷 、 连 接 方式 等 用 以 在 psfgen 中 调用 , 生成 体系 的 psfgen 文件 。 XF top Ж 
件 的 格式 可 以 参考 namd-tutorial (http://www.ks.uiuc.edu/Training/Tutorials/) 的 附录 三 。 

5. 制作 psf 文件 

首先 把 chainA/B.pdb 中 包含 原子 坐标 的 最 后 2 行 移 至 最 前 。 然后 在 TkConsole 中 依次 
输入 ， 如 下 指令 。 

package require psfgen 

topology (ор _all27_prot lipid.inp 

pdbalias residue DLE ГЕП 

pdbalias residue DVA VAL 

pdbalias atom ЕТА О ОС 

segment СА! í pdb chainApdb } 

segment GA2 í pdb chainB.pdb ; 

coordpdb chainA.pdb GAI 

coordpdb chainB.pdb GA2 

guesscoord 

writepsf ргоісіп.рвҒ 

运行 结束 后 在 当前 目录 下 生成 protein pdb/psf 3 

ZE VMD 和 psfgen 中 同时 有 一 个 命令 叫 writepd 
在 前 面 以 一 个 变量 开始 ， 在 psfgen 中 直接 开始 。writepdb 可 以 覆盖 原来 的 ра 
出 任何 提示 ,如 果 对 操作 正确 性 没有 把 握 。 BARTAKKE. чий 


有 键 、 角 、 二 面 角 等 ， 即 可 用 于 VMD тан, а мамо ЖОМЕ 
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的 必要 信息 。 在 NAMD 运行 时 候 ， EARE УКА чымы 的 不 变量 ， 同 时 从 pdb 文件 
ЕНА. | 

psfgen 有 2 种 调用 方式 : 

W 随 NAMD 安装 包 一 起 发 行 的 有 psfgen 文件 ， 此 文件 在 控制 台 终 ТЕКИ; 

@) VMD 中 有 一 个 plugin 名 叫 psfgen, 在 TkConsole тин. 调用 前 需要 运行 ,package 
require psfgen. 

因 后 者 具有 目 动 补 全 、 语 法 高 亮 等 功能 ， HRE VMD 中 的 其 他 功能 同时 使 用 ， 推荐 
这 种 方式 。 

guesscoord 为 月 动 补 爹 缺 失 原 子 的 命令 。 蛋 白质 结 构 获 得 的 主要 手段 是 X 射线 衍射 
(XRD) 或 NMR， 这 两 种 技术 都 不 能 精确 定位 H 原子 ， 所 以 在 原始 的 pdb 文件 中 一 般 并 
FARTAS. эе T раа 息 (IC T 和 简单 猜测 来 
补 全 这 些 缺 失 原 子 的 坐标 。 | 

6. 构建 膜 

VMD 中 有 一 个 plugin 名 叫 membrane, 可 以 快速 生成 一 个 双 分 子 层 质 膜 结构 。 但 目前 
只 支持 POPE 和 POPC 两 种 质 膜 模型 。 在 VMD 中 的 TkConsole 中 输入 : 

package require membrane 

membrane -І POPE -х 50 -y 50 

此 命令 可 以 生产 50 A х 50 A 的 POPE 膜 ， 在 当前 目录 下 生成 名 为 membrane.pdb/psf 
的 文件 。 

7. 调整 结构 

由 membrane plugin 生成 的 膜 的 x、y 坐标 中 心 不 在 原点 ， 需 通过 移动 使 之 到 达 坐 标 原 
кг 85) VMD， 在 TkConsole 下 输入 : 

mol load pdb membrane.pdb psf membrane.psf 

可 以 通过 命令 行 交 互 模式 载 入 分 子 ， 再 输入 ， 

set mem | atomselect top all | 

measure center $mem 

可 以 得 到 体系 中 心 的 坐标 ， 此 例 中 为 (-22.67，-22.43，-0.76)。 然 后 运行 ; 

$mem moveby { 22.67 22.43 0.76 } 

$mem writepdb membrane.pdb 

得 到 坐标 调整 的 膜 坐 标 文 件 

载 入 第 5 小 节 中 生成 的 protein.pdb/psf 文件 ， 检 查分 子 结构 是 否 正确 。 

mol load psf protein.psf pdb protein.pdb 

管子 的 轴 间 接近 平行 于 y 方 癌 , 要 把 它 调整 到 z 方 向 去 ,。 NAMD 处 理 半 各 向 同性 体系 
(semi-isotropic) М, SKA z 方 向 是 垂直 于 各 向 同性 的 方向 。 

set sel [ atomselect top all ] 

$sel move [ trans center {0 0 0) axis x 95 | 

$sel move [ trans center {0 0 0) axis у 10 | 

bsel writepdb protein aligned.pdb 

此 时 管 轴 已 非常 接近 于 平行 z 轴 , 车 不 满足 可 以 通过 精心 的 手 调 使 之 平行 , 或 通过 tcl 
ЖЕНІЛ ІНІ, ЖАНЫН Ж. 
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2 move 和 inoveby 是 2 个 移动 体系 坐标 的 命令 .move / 8 44 ИЕМ, “可 以 同 
时 完成 平移 和 旋转 操作 ， 但 直接 书写 这 个 矩阵 较为 复杂 ， 可 以 用 trans: Шалы: moveby 后 面 
接 一 个 方向 矢量 ， 完 成 平移 操作 . 

8. 把 СА ЖАЛ 

此 处 可 以 使 用 Пуа Balabin 提供 的 combinetcl 脚本 实现 。 可 以 到 
http://www.ks.uiuc.edu/Research/vmd/plugins/membrane/ 下 载 这 个 脚本 文件 。 使 用 此 脚本 时 ， 
TkConsole 当前 目录 为 上 述 步骤 制作 的 protein aligned.pdb、protein.psf、membrane.pdb/psf 
文件 以 及 top all27 prot lipid.inp 文件 。 在 控制 台 输 入 : 

уша -dispdev text -e combine.tcl 

即 可 把 GA ЛАН, НИН GA 重 登 的 脂 和 水 分 子 ， 生 成 protein mem.pdb/psf 
文件 。 

9. 补充 水 

因为 自动 生成 的 膜 包 含 的 水 太 少 ， 没 有 达到 使 膜 充分 水 化 的 要 求 ， 需 要 额外 在 膜 两 侧 
加 些 水 。VMD 中 有 个 plugin 名 叫 solvate， 可 以 以 多 种 方式 对 体系 加 水 。 对 该 体系 ， 在 两 
侧 加 水 的 操作 为 : 

solvate protein mem.psf protein mem.pdb -minmax {{-25 -25 27} {25 25 
40}} -o protein тет sl 

solvate protein mem sl.psf protein mem sl.pdb -minmax {{-25 -25 -40) 
{25 25 -27|} -s WT2 -0 protein mem s 

至 此 建 模 操作 完成 , 整个 体系 约 含 有 15000 个 原子 .46 个 脂 分 子 ,下 面 即 可 使 用 NAMD 
进行 分 子 动力 学 计算 。 ЕС 2 4  - < 

solvate plugin 是 VMD 中 一 个 重要 的 工具 ， 它 的 开 作 方式 是 把 分 子 放 人 
ы са ДЕ 


分 子 帮 入 i fera VA A、 中 心 在 原点 的 Ты. Е 
ӨРТТЕР Жанай б м 
solvate бора Кор z 10 +z DO O o aa 
TU A AARAA 10 ARA AB. 人 УД wanrakuna 
хай. | 227. 

ожа хин. TUMA: sil s o 

solvat foopsf бор - 10 

在 6 个 方向 都 补 加 10 À ЖА. 
анн танан 


“=з н дур 


pibe te ri P Das hs 
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ЛАЯ рар 文件 ， 可 以 生成 一 个 纯 的 水 盒子 ,此 时 只 能 用 -minmax 选项 
模型 建立 后 ， 未 进行 结构 优化 时 的 构象 见 图 7-20。 


(b) 俯视 图 ， 水 分 子 没有 画 出 
图 7-20 ”模型 建立 后 ， 未 进行 结构 优化 时 的 构象 


四 、 分 子 动力 学 模拟 

现在 建立 的 模型 远 远 不 是 平衡 态 , 而 只 是 手工 建造 的 一 个 体系 , 有 很 多 不 合理 的 地 方 ， 
如 筷 白 质 和 脂 分 子 之 间 有 很 大 的 空 除 。 要 得 到 真实 的 体系 ， 必 须 进 行 复 杂 的 预 处 理 过 程 。 
因 重 日 质 的 结构 取 自 XRD 或 ММА 实测 值 ， 为 蛋白 质 的 天 然 稳 定 构象 。 为 了 能 快速 而 准 


Же жылғы ЛТ аЛ 124531) 


确 地 完成 预 平衡 过 程 ， 需 要 首先 限制 重 白 质 骨 架 进 行 充 分 的 MD 过 程 ， 使 得 脂 和 水 分 子 达 
到 平衡 。 然 后 全 部 放 开 进行 长 时 间 的 MD 过 程 。 

因为 现在 处 理 的 体系 较为 简单 ， 且 为 节省 篇 幅 ， 只 做 一 次 
力学 过 程 和 全 部 放 开 的 动力 学 过 程 。 实 际 的 处 理 远 远 较 此 复杂 。 

1， 预 平衡 1: 能 量 最 小 化 和 限制 С 的 结构 优化 过 程 

CO 限制 С" 的 位 置 МАМЫ 固定 /限制 茶 些 原子 的 动力 学 模拟 过 程 ， 可 以 通过 标记 
文件 中 的 occupancy zü B 列 指定 所 要 固定 /限制 的 原子 而 实现 。 下 列 命令 可 以 给 pdb 文 
件 中 C* 的 B 值 设 为 1， 其 他 设 为 0。 

mol load pdb protein mem s.pdb 

set all | atomselect top all | 

set ca | atomselect top “protein and name СА” | 

$all set beta 

$ca set beta 1 

执行 结束 后 得 到 文件 constr.pdb， 文件 内 容 除 B 列 外 ， 其 他 均 同 于 protein mem s.pdb， 
用 以 指定 所 要 限制 的 原子 。 

(2) 配置 文件 详解 NAMD 运行 所 用 的 绝 大 部 分 参数 写 在 一 个 文件 中 ， 这 是 一 个 纯 
文本 文件 且 不 依赖 于 后 缀 名 《后缀 名 一 般 为 пата 或 conf), WAT Unix 系统 下 的 使 用 风 
Ж. ЖХЖНУа ға conf， 并 称 之 为 配置 文件 或 conf 文件 。conf 可 以 识别 tcl 命令 ， 例 如 
定义 变量 ， 判 断 、 循 环流 程控 制 等 。 

能 量 最 小 化 和 限制 C” 的 动力 学 过 程 可 以 写 在 同一 个 conf 文件 中 ， 文 件 名 eqlconf。 
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8 量 最 小 化 、 限 制 C 的 动 


tructur protein тет s.psf 
coordinates protein mem s.pdb 

指定 所 要 模拟 的 体系 的 结构 文件 和 坐标 文件 。 

рагаТуреСНАКМт оп 

yaramete par all27 prot lipid.inp 

parameters par extraterms.inp 

指出 所 用 力 场 类 型 为 CHARMm 力 场 ， 并 指定 力 场 的 参数 文件 名 。 力 场 参 数 文 件 含有 
各 种 类 型 原子 的 兰 纳 德 琼斯 (LD 参数 以 及 不 同 原子 之 间 的 键 、 键 角 的 力 常数 和 平衡 值 等 

本 例 中 市 有 非 标准 残 基 的 力 场 参数 文件 可 从 http://www.ks.uiuc.edu/Research/namd/tut- 
orial/NCSA2002/hands-on/sample/par all27 prot lipid.inp 和 http:/Awww.ks.uiuc.edu/Research/ 
namd/tutorial/NCSA2002/hands-on/sample/par-extraterms.inp РЭК 

这 一 句 定 义 了 一 个 变量 temperature 并 赋值 310， 在 下 面 使 用 这 个 数值 时 候 可 以 引用 
该 变量 。 

tcl 变量 通过 开头 加 $ 访 问 。 

设 定 初始 化 温度 ， 用 以 给 系统 内 各 个 原子 按照 Maxwell 分 布 律 赋 速度 祝 
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本 例 中 ， 初 始 化 温度 取 自 变量 temperature， 值 为 310，NAMD 的 默认 温度 单位 为 К. 


сеПВавів Уесісгі 50. 0 O. 
cellBasisVector2 0 50 0. 
cellBasisVector3 0. 0. 80. 
cellOrigin 0. 0. 0. 
wrapAll 


在 NAMD 和 VMD 中 ， 陵 认 的 长 度 单位 是 А. МАМЫ 不 仅 能 处 理 正 交 盒子 ， 还 能 处 
理 任何 夹 角 的 平行 六 面体 盒子 ，cellBasisVector 是 盒子 三 条 边 的 方向 矢量 GER). lth, 
NAMD 还 可 以 处 理 球形 边界 和 圆柱 形 边 界 。 

PMEGridSizeX 64 

PMEGridSizeY 64 

“НН particle mesh ewald (PME) 方法 计算 静电 力 ， 此 方法 需要 手工 设 定 划分 

各 目的 数目 ，PMEGridSize 选择 略 大 于 相应 盒子 边 长 的 ， 且 能 分 解 为 只 包含 2、3、5 约 数 
的 正 整数 。 


exclude scaled1-4 
cutoff 10. | 
switching on 
switchdist 8. 
pairlistdist 12. 


指定 范 德 华 力 的 截断 半径 cutoff、 开 关 函 数 起 始 位 置 switchdist 和 verlet 列表 (第 二 截 
断 半 径 》pairlistdist 的 数值 等 。 其 中 pairlistdict 的 数值 直接 影响 计算 速度 。 


timestep 1. 
nonbondedFreq 2 
fullElectFrequency 4 
stepspercycle 20 


КЕРНК, PRE i 

分 子 动力 学 模拟 的 瓶颈 是 范 德 华 力 和 静电 力 的 计算 , 这 一 部 分 占 总 模拟 时 间 的 95% 以 
上 。NAMD 采用 多 时 间 步 长 的 方式 计算 这 些 相互 作用 ， 使 得 计算 耗 时 大 大 减少 。 在 这 个 例 
子 中 ， 范 德 华 力 每 2 步 计 算 1 次 ， 静 电力 每 4 步 计 算 一 次 ， 每 20 步 更 新 一 次 verlet 列表 。 


“- 


Тапсеуіп оп 

langevinTemp $ temperature 

langevin 控 温 的 参数 ， 使 体系 温度 恒定 在 310OK (37 `C) 附近 。 
langevinPiston on 


langevinPistonTarget 1.0 
langevinPistonPeriod 100. 
langevinPistonDecay 50. 
langevinPistonTemp $ temperature 
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langevin 控 压 的 参数 ， 使 体系 压力 恒定 在 1 bar (10°Ра) И. ЖАМ 

的 主要 目的 是 调节 盒子 的 大 小 ， 使 不 全 于 出 现 真 空 区 。 

useFlexibleCell yes 

useConstantRatio yes 

这 是 两 个 用 于 膜 体 系 模拟 的 参数 。 这 个 体系 为 半 各 向 同性 体系 , 当 盒子 的 边 长 变化 时 ， 
在 平行 于 膜 的 两 个 方向 (x. y) 上 等 比例 变化 。 
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if {1} í 

constraints on 

consref constr.pdb 
conskfile constr.pdb 
conskcol B ` 
сопвігашізсайпр 10.0 

} 


这 个 系列 的 参数 用 于 限制 Ce 原子 的 运动 ， 即 给 每 个 Cs 原子 施加 偏离 constrpdb 文件 
中 指定 位 置 的 谐 力 ， 力 常数 存储 在 constr.pdb 文件 的 B 列 。 因 其 数值 为 1， 再 乘 以 因子 10, 
可 得 力 常数 的 数值 为 10， 单 位 кса/А. 

if (1) о) A t 条 件 控制 语句 。 例 子 中 条 件 关系 式 为 1， 恒 为 真 ， 其 中 的 所 有 设 
置 都 会 被 读 入 。 如 果 改 为 0， 则 恒 为 假 ， 所 有 设置 均 被 忽略 。 可 用 此 对 若干 行 语句 进行 开 
关 设置 ， 而 不 需要 逐 行 注释 或 删除 。 


binaryoutput no 
outputName еді о 
dcdfreq 1000 
xstF 1000 


stFreq 
NAMD 有 多 个 输出 文件 ， 如 坐标 《〈《*.coor)、 轨 迹 〈*.dcd)、 速 度 〈*.vel)、 盒 子 的 尺 
У (*xsc/xst) 等 ， 这 些 文件 在 例子 中 的 名 字 为 eq1_o, 8 1000 zF (Ips) 存储 1 次 轨迹 和 
盒子 尺寸 。 
binaryoutput 选项 设 定 使 用 ascii 编码 仓储 *.coor 和 *.vel WIF, 这 类 文件 采用 pdb 文件 


Ж. 
restartname еді г 
restartfreq 1000 


在 运行 中 保存 一 些 中 间 文 件 ， 当 计算 因为 某 些 原因 中 断 〈 如 停电 ) 后 ， 可 以 根据 这 些 
文件 继续 进行 计算 。 这 些 文件 中 包含 坐标 ， 速 度 和 盒子 尺寸 等 信息 。 例 子 中 每 1000 HF 
ҺЕ 1 次 。 

outputEnergies 1000 

NAMD 运行 时 会 输出 体系 的 很 多 信息 ， 这 是 最 午 要 的 一 条 ， 它 输出 能 量 、 注 度 、 压 
力 、 体 积 等 若干 很 重要 的 信息 。 默 认 每 步 输出 1 次 。 现 在 为 1000 步 输出 1 А. 

IMDon on 

IMDport 12345 

IMDífreq 100 

实现 交互 分 子 动力 学 〈interactive molecular dynamic, IMD) 的 设置 ， 将 在 下 面 介绍 。 
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minimize 500 


reinitvels $temperature 


} 

首先 进行 500 次 能 量 最 小 化 计算 ，NAMD 提供 多 种 优化 方法 ， 选 取 默 认 即 可 。 在 进 
行 能 量 最 小 化 后 ， 体 系 速度 为 0。 用 reinitvels 命令 给 体系 各 个 原子 重新 赋 速 度 初 值 。 

run 10000000 进行 10000000 (10 ns) 步 动力 学 过 程 。 完 成 
后 结束 。 

以 上 内 容 是 完整 进行 一 次 NAMD 运行 过 程 所 需 的 配置 文件 的 内 容 , 但 远 非 NAMD 的 
全 部 功能 。 关 于 NAMD 可 以 使 用 的 命令 可 以 参考 NAMD 的 用 户 指 南 (NAMD user's guide), 
当 一 次 过 程 运 行 结束 后 ， 可 以 得 到 如 下 几 个 文件 ，eq1_o0.coor〔 结 束 时 的 坐标 ); eql_o.vel 
(结束 时 的 速度 )，eq1_o.xsc〈 结 束 时 盒子 的 尺寸 )，eq]_o.ded (运动 轨迹 )。 

(3) 运行 方式 ”NAMD 在 单个 сри 下 非常 简单 ， 只 需要 运行 namd2 eql.conf 即 可 。 

单机 多 核 运行 ， 需 要 开启 rh 或 ssh 服务 ， 且 当前 用 户 可 以 无 密码 登录 本 机 。 然 后 
运行 ， 

charmrun пата2 +р<п> eql.conf 

<n> 为 使 用 的 计算 核心 的 数目 。Windows 下 使 用 方法 同上 ， 但 在 运行 前 需要 先 运 行 安 
装 目 录 下 的 charmd。 

多 节点 运行 ， 每 个 节点 丝 需 开启 ssh 或 rsh 服务 ， 且 各 个 节点 之 间 可 以 无 密码 登陆 。 
在 运行 目录 下 建立 nodelist 文件 ， 在 这 个 文件 中 指定 所 使 用 的 节点 。 然 后 运行 ; 

charmrun namd2 +р<п> eql.conf 

当 使 用 ssh 进行 通讯 时 ， 只 能 在 csh 下 使 用 ， 日 要 设置 环境 变量 

setenv CONV RSH ssh 
多 节点 并 行 时 ，namd2 文件 在 每 个 节点 上 目录 应 相间 ， 最 好 放 在 公共 NFS 服务 器 上 . 
如 果 并 行 时 报错 ，<configure flo 用 绝对 路 径 试 试看 。 | 

运行 时 ， 输 出 的 屏幕 (stdout) 上 的 信息 也 十 分 重要 ， 需 要 把 这 些 信 息 保存 在 一 个 文 
件 中 。 可 以 用 linux shell 提供 的 输出 重 定向 功能 ; 

namd? eql.conf > eql.log 

可 以 把 原本 输出 在 屏 句 上 的 信息 输出 到 eq.log 文件 中 去 ， 或 是 用 : 

namd? egl.conf | ісе eql.log 

输出 信息 可 以 同时 输出 到 屏幕 和 指定 的 文件 中 ， 并 行 计 算 时 类 似 。 

-10og: 文 件 是 极 重要 的 输出 文件 ， 它 采用 精心 设计 的 格式 ， 既 容易 直接 阅读 ， 也 容易 被 
多 种 文本 操作 工具 (如 ер. сш 和 awk 等) 处 理 , 其 中 以 “ENERGY: ”开头 的 一 行 包含 
了 模拟 过 程 中 体系 的 能 量 、 温 度 、 压 力 、 体 积 等 多 种 信息 ， 通 过 监视 这 些 量 的 变化 可 以 判 
断 模 拟 进 行 的 程度 。VMD 中 有 一 个 plugin 叫 namdplot， 可 以 很 方便 地 根据 这 企 文件 做 出 
某 个 物理 量 随时 间 的 变化 趋势 。 打 开 extensions | analysis | NAMD plot, Ашы ыш 
用 这 个 plugin。 并 不 是 每 个 plugin 都 有 图 形 界 面 . 在 TkConsole 窗口 输入 : 

namdplot TEMP eql.log 

可 以 以 命令 方式 调用 这 个 plugin， 并 绘 出 图 形 。  . 

(4) Interactive MD 的 实现 通过 监视 log 等 文件 ， 可 以 实时 了 解体 系 的 状态 。 而 对 于 
想 要 “看 到 ”体系 结构 的 实时 变化 , 则 可 以 通过 VMD 实现 这 个 功能 , 连接 NAMD E VMD 
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的 协议 就 是 IMD。IMD 最 重要 的 功能 是 可 以 手工 在 模拟 过 程 中 给 体系 的 某 一 部 分 施加 力 ， 
但 这 种 模拟 技术 需要 较 深 的 理论 功底 才能 得 到 有 意义 的 结论 ， 在 这 里 不 介绍 。 两 个 软件 连 
用 的 实现 方式 是 NAMD 运行 时 开局 一 个 网 络 端口 做 服务 器 端 ， 等 待 VMD ME, VMD 
作为 客户 端 接 入 。 

在 NAMD 中 ， 与 IMD 有 关 的 主要 参数 有 3 个 -: 

DIMDon ”<onoroff> # ESHE., ЖЗА off. | 

(2 IMDport <Е#& > #NAMD 开启 的 网 络 端口 ， 最 好 在 1024-65535, ЖЕ 
不 要 与 其 他 常用 软件 的 端口 号 相同 。 在 CMD 窗口 使 用 netstat -an ЫЫ зый жашы 
他 软件 万 据 的 端口 号 。 sas 

Ө IMDfreq ` < 正 整数 > # И умп Елена. 
“在 VMD 38: s l HO 

(0) ЖЛ protein mem s.psf 文件 ， 并 确保 其 为 top 分 子 . 

() 打开 菜单 Extensions | Simulation | IMD connect, 缮 出 一 个 新 窗口 ， | 

图 在 hostnamd 中 填 入 NAMD 计算 主机 (master) 的 ip, 各 果 NAMD 和 MD 在 
NELT, 这 里 可 以 填 入 127.0.0.1, 在 Po ТИ ш РИК. 54 

@ 点 coinect， 即 可 实现 JIMD 和 连接 。 2 

若 以 命令 方式 调用 ， 可 以 在 TkConsole PRA: 

imd connect servername/p port | 

2， 预 平衡 2: 全 放 开 的 结构 优化 过 各 

接 下 来 放 开 对 蛋白 质 的 C, 的 限制 ， 进 行 长 时 间 的 动力 学 模拟 过 程 ， 使 体系 充分 达到 
平衡 。 总 的 模拟 时 间 为 10 ns。 在 前 一 过 程 的 基础 上 进行 下 一 步 的 模拟 过 程 ， 配置 文件 大 部 
分 内 容 同 上 ， 只 需要 在 此 基础 上 修改 几 个 地 方 即 可 。 

(1) 将 structure 后 的 文件 名 改 为 eql_o.coor; 

D 盒子 信息 按照 eql_oxsc 中 写 入 ; 

(8) outputName 和 restartName 分 别 改 为 eq2_o 和 eq2_r; 

(2) 并 把 限制 Co 和 能 量 最 小 化 的 2 个 应 中 条 件 关系 式 的 1 改 为 0。 

完成 新 过 程 的 配置 文件 的 修改 ， 命 名 为 eq2.conf， 然 后 用 前 述 方法 运行 即 可 。 在 配置 
文件 中 ， 指 定 这 些 文件 的 时 候 可 以 使 用 绝对 路 径 或 相对 路 径 引 用 其 他 目录 下 的 文件 ， 而 不 
要 求 一 定 在 配置 文件 所 在 的 目录 下 。 

因为 一 个 课题 需要 若干 过 程 才 能 完成 ， 为 使 工作 有 条 理 、 减少 Bi 可 以 把 每 步 模 报 
过 程 放 到 一 个 独立 的 目录 中 ,例如 为 建 模 和 2 步 预 平衡 分 别 建立 目 build /seq1/ 和 e 
另外 一 些 公共 文件 ， 如 力 场 文件 ， psf 文件 ， 可 以 单独 存放 在 某 相 目录 中 

3. 平衡 分 子 动力 学 过 程 的 模拟 

当 确 信 一 个 体系 达到 平衡 态 之 后 ， 就 可 以 进行 正式 的 分 子 动力 学 模拟 过 程 了 。 为 在 一 
定 计算 资源 和 时 间 下 ， 尽 可 能 增长 实际 的 模拟 时 间 ， 可 以 采用 2 fs 的 时 间 步 长 。 但 此 时 需 
要 限制 H 原子 的 伸缩 震动 。 

在 配置 文件 中 添加 : — rigidBonds All 

这 个 选项 会 将 各 个 H 原子 与 重 原子 的 键 长 限制 在 某 个 数值 上 。 这 个 数值 为 力 场 中 规 
定 的 平衡 键 长 ， 而 不 是 初始 结构 的 键 长 。 

然后 修改 : timestep 2.0 
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即 可 设置 模拟 的 时 间 步 长 为 25, 18) 15 相 比 可 以 在 相同 的 计算 时 间 内 进行 2 倍 实际 
时 间 的 动力 学 计算 ， 提 高 了 计算 效率 。 

修改 outputName 和 restartName， 分 别 改 为 md о 和 md г. 

此 时 进行 的 模拟 为 平衡 分 子 动 力学 过 程 ， 使 用 多 的 步 数 只 是 增加 取样 量 , 减少 统计 误 
差 。 因 这 个 例子 只 是 在 演示 МАМЫ 处 理 分 子 动力 学 计算 的 方法 , 此 处 总 模拟 时 间 为 20 ns. 
实际 使 用 时 可 以 选取 更 长 的 模拟 时 间 。 可 以 将 这 个 脚本 命名 为 md.conf， 这 个 任务 在 一 个 
名 为 md 的 文件 炎 中 进行 。 


五 、 可 视 化 与 数据 处 理 

VMD 既是 一 款 分 子 视图 软件 ， 能 在 图 形 界面 下 完成 视图 、 动 画 以 及 若干 数据 处 理 功 
НЕ, ARE td 脚本 语言 ， 使 得 它 可 以 以 流程 控制 的 方式 完成 更 高 级 的 任务 。 下 面 简单 
介绍 几 种 VMD 处 理 数据 的 方法 。 

1， 图 像 显示 与 render 

VMD 能 以 多 种 风格 进行 分 子 视图 处 理 ， 从 而 制作 
ТЕ: 

载 入 ед2 о.соог 文件 ， 注 意 此 时 file type 选 pdb 而 不 是 使 用 默认 选项 

点 击 菜 单 Display | Orthographic， 这 时 视图 方式 为 正 区 而 不 是 迁 视 ; 

点 击 菜单 Display | Axes | ОВ, ВАН; 

打开 菜单 Graphics | Colors | display | background | 8 white， 设 置 背景 为 白色 ; 

(5) 打开 菜单 Graphics | Representations， 可 以 设 定 多 个 representation， 每 个 可 以 指定 
不 同 的 显示 方式 ， 着 色 方 式 和 需要 显示 的 特定 原子 的 类 型 。 表 7 -1 列 出 了 一 个 适合 本 例 的 
组 合 ， 效 果 如 图 7-21 所 示 。 


表 7-1 VMD 制作 结构 图 时 ， 各 个 representation 的 设置 


syle жой 


Bond Radius Ж 0.1 
脂 质 中 的 N 和 P 原子 
管 中 的 水 分 子 


除了 可 以 通过 截图 保存 图 像 外 ,还 可 以 通过 VMD 提供 上 { 

式 的 文件 。 当 调 整 分 子 在 窗口 中 的 位 置 后 ， 打 开 菜单 ”File | Render ”， 模 式 选 кадр: 可 
以 保存 为 bmp 格式 的 图 片 ， 但 分 辩 率 不 可 调 ; 其 他 多 种 模式 都 可 以 任意 设 定 分 辩 率 ， 比 如 
tachyon。tachyon 模式 除 生成 іра 格式 的 图 像 外 ， 还 生成 一 个 dat 文件 。 使 用 其 他 辅助 工具 
可 以 将 这 个 dat 文件 转化 为 图 像 格式 。 如 果 采用 默认 安装 ， 使 用 VMD 软件 包 中 的 
转换 工具 的 运行 方式 如 下 

Jusr/local/vmd-1.8.7beta5/libttachyon/tachyon LINUX -format bmp -гев 2000 2000 
eq2 0.dat 

此 即 可 将 dat 文件 转化 为 高 分 辨 (2000 Pixel x 2000 Pixel) 的 bmp 格式 的 图 像 。 
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图 7-21 VMD 制作 出 的 体系 结构 图 


2. 查看 轨迹 文件 

VMD 除 能 制作 静态 的 图 片 外 ， 还 可 以 载 入 ded 文件， 以 动画 方式 显示 。ded 文件 是 
NAMD 产生 的 轨迹 文件 ， 这 个 文件 存 屠 了 若干 个 不 同时 刻 的 体系 原子 坐标 “ 帧 ，frame)。 

首先 载 入 protein mem s.psf 文件 , 然后 载 入 eql_o.dcd ЖЇР, 请 注意 此 时 “load file for” 
窗口 后 面 选择 这 个 psf 文件 图 7 -22。 在 frames 框 中 可 以 设置 载 入 的 帧 。first 为 开始 的 帧 数 ， 
0 为 开始 第 一 帧 ，last 为 结束 的 帧 数 ，-1 为 文件 的 最 后 一 帧 ，stride 可 以 设 定 每 隔 多 少 帧 读 
取 一 次 。 因 为 要 把 所 有 的 轨迹 数据 加 载 到 内 存 之 中 ， 需 要 花费 一 定 的 时 间 。 在 前 面 的 模拟 
H, egl ожа 的 文件 大 约 有 17 G， 要 求 系统 至 少 有 1.7 G 的 空闲 内 存 ， 如 果 内 存 不 够 大 
可 以 把 stride 设 得 大 一 些 。 在 main 窗口 (图 7 -23) 下 面 有 2 行 控制 动画 的 工具 ， 功 能 同 
视频 播放 软件 类 似 。 
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图 7-3 载 入 轨迹 文件 后 的 main 窗口 。 


3. 使 用 Labels 计算 键 长 
Labels 是 VMD 在 图 形 界面 使 用 方式 中 一 个 数据 分 析 工 具 ， 下 面 介绍 使 用 Labels Ж 
计 两 个 原子 间 本 的 方法 。 在 两 条 链 的 尾 段 有 多 条 氢 键 把 两 个 分 子 组 装 成 二 聚 体 ， 这 里 考察 
每 条 链 的 第 一 个 残 基 (VAL) 上 的 氨基 气 同 另 一 条 链 的 第 五 个 残 基 (САТА) KARER 
间 的 氢 键 。 
RA ед2 o.ded 轨迹 文件 ， 在 representations 中 设置 selections 为 backbone or resname 
FOR or resname ЕТА and noh ог пате HN, 可 以 较 清晰 地 显示 和 蛋白质 的 骨架 结构 。 然后 点 击 
菜单 Mouse | Labels | Bonds, IRTE display 窗口 激活 后 按 快 捷 键 “2”， 使 鼠标 变 为 Label 模 
式 。 在 display 窗口 依次 选择 原子 并 单 击 ， 诛 子 的 类 型 和 键 的 长 度 会 出 现在 窗口 里 面 。 
打开 菜单 Graphics | Labels， 出 现 Labels 窗口 (图 7-24)。 在 下 拉 菜 单 中 选 Bonds， 标 
签 页 中 选 Graph. 选择 一 个 键 之 后 点 击 Graph 按钮 , 可 以 绘 出 键 长 随时 间 的 变化 , 或 按 Save 
按钮 ， 可 以 将 数据 存储 在 一 个 文本 文件 中 。 在 


本 例 中 可 以 看 到 这 两 个 氨 键 键 长 在 1.9 A 左右 波 | шет. андараш ш | 
动 ， 在 模拟 过 程 中 没有 断裂 。 mamani = шз эшш! 
Labels 中 的 Bonds 只 是 计算 两 个 原子 之 间 | 


的 距离 ， 不 要 求 这 两 个 原子 真 的 通过 共 价 键 连 
在 一 起 . 像 本 例 中 和 氢 键 两 问 的 原子 就 没有 键 连 
在 一 起 . 
4. 使 用 tel 脚本 计算 蛋白 质 的 RMSD 
通过 使 用 VMD 提供 的 ісі 脚本 功能 ， 计 算 
在 全 部 放 开 优化 过 程 中 和 蛋白质 的 RMSD 的 变 
化 ,将 如 下 内 容 制 作成 文件 rsmd.tcl, FA ед2 图 7-24 ” 选 定 气 键 后 的 Labels 窗口 
目录 中 。 
mol new protein тет s.psf 
то! addfile ед2 o.dcd first 0 last -l step 10 waitfor all 
nf [ molinfo top get numframes | 
ref [ atomselect top "backbone" бате 0 | 
sel | atomselect top "backbone" | 
all [ atomselect top all | 
{ set i O } { Si < $nf } í incr 1 } í 
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$sel frame $i 
$all frame $i 
$all move | measure fit $sel $ref | 
puts "$1М[ measure rmsd $sel $ref |" 
quit 
使 用 VMD 脚本 模式 运行 该 文件 ， 将 输出 重 定向 到 文件 中 
vmd -dispdev text -e rmsdtcl | tee rmsd.dat 

运行 结束 后 RPT DER Жа ТЯ rmsd.dat СЕ 
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5， 使 用 Ырс 计算 膜 厚度 

膜 厚度 有 不 同 的 定义 方法 ， 这 里 采用 一 个 简单 的 ， 即 计算 两 侧 P 原子 距离 的 方法 。 本 例 
中 蛋白 质 结构 简单 取 自 NM 实验 值 ， 且 分 子 较 小 、 结 构 简 单 ， 优 化 时 候 很 快 达 到 平衡 。 相 
对 于 蛋白 质 ， 膜 的 平衡 是 较 难 达到 的 ， 可 以 通过 监视 膜 厚度 的 方法 判断 优化 进行 的 程度 。 对 
POPE 膜 ， 通 过 计算 P 原子 距离 得 到 的 厚度 在 37-38 А. 

对 于 体积 太 大 不 能 加 载 到 内 存 中 的 脚本 , 可 以 使 用 catdcd 编辑 轨迹 文件 使 体积 变 小 后 处 
理 ， 也 可 以 使 用 bigdecd。bigded 使 用 tcl 语言 编写 它 提供 了 一 个 处 理 大 轨迹 的 用 户 接 口 ， 其 
工作 原理 是 每 次 处 理 完 一 个 frame 后 即 把 它 从 内 存 中 删除 。 从 http://www.ks.uiuc.edu// 
Research/vmd/script_library/ 下 载 bigded .tcl 文件 ， 编 辑 如 下 脚本 ， 命 名 为 thickness.tcl。 

source bigdcd.tcl 

set ошбе | open thickness.dat w | 
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proc myth { бате } { 

global mol outfile 

pl | atomselect top "name Р and 2 > 0" | 
p2 | atomselect top "пате Р and z < 0" | 
zl [ lndex [ measure center $р1 | 2 | 
z2 | lndex | measure center $p2 | 2 | 
th [ expr $zl - $22 | 

$outfile "$framet$th" 

) 

set то! | mol new protein mem s.psf waitfor all | 
бірісі myth eql/eql_o.ded ед2/ед2 оса 

ыраса мал 

close Фош е 


qutt 
运行 结束 后 ， 会 目 动 生成 一 个 新 的 文本 文件 thickness.dat， 可 以 使 用 任何 一 款 文本 编辑 
器 查看 或 是 用 数据 处 理 软 件 如 xmgrace 、excel 等 编辑 作 图 。 图 7-25 为 本 例 中 的 结果 。 


Ü 5 10 ы 
时 间 /ns 
7-25 AFERE? 次 预 平衡 过 程 中 随时 间 的 变化 趋势 
在 最 先 部 分 膜 厚度 急剧 下 降 后 缓慢 上 升 ，10ns 时 候 〈 预 平衡 1 结束 时 ) 达到 期 望 值 37A。 后 1005 ( 预 平衡 2) 
过 程 在 期 望 值 附 近 波 动 。 可 以 认为 经 过 两 次 预 平 衡 ， 体 系 充分 达到 了 平衡 状态 


2. ук. А ту oine" Ші 40 з an S 
| ргос ий I fame. у I. 1% ЖАННАТЫ? Et Естің: ; А 
Т xx tma. Бағы anata fame, жырына aunas 
设置 mol 和 outfle JARRE; 定义 它 的 位 置 在 这 个 函数 туыр | 

set zl [ мех | measure center брі J 2] 两 行 … 
НА Р 原子 的 坐标 中 心 ， 并 将 z те | 

set th | expr $21 - 82 | 222. 


第 七 章 蛋白质 结 构 的 分 子 动力 学 模拟 


ly L 


第 四 节 ”利用 GROMACS 进行 分 子 动力 学 模拟 操作 


—. GROMACS 介绍 

GROMACS 全 称 为 Groningen Machine for Chemical Sinmmulations， 是 一 款 最 初 由 荷兰 罗 宁 
根 大 学 (Groningen University) 开发 的 开源 分 子 动力 学 模拟 软件 包 ," 现在 主要 由 瑞典 乌 普 萨 
拉 大 学 《Uppsala University) 和 斯 德 哥 尔 摩 大 学 (Stockholm University) 以 及 德国 马 普 学 会 高 
分 子 研究 所 (The Max Planck Institute for Polymer Research) 共同 维护 管理 。 

GROMACS 设计 的 初衷 主要 是 为 了 用 于 生物 大 分 子 如 蛋白 质 、DNA、RNA 等 物质 的 计 
算 、 分 析 。 后 来 由 于 其 在 模拟 大 分 子 系统 的 牛顿 运动 方面 具有 极 大 的 速度 优势 ， 很 多 研究 机 
构 也 用 其 来 计算 、 研 究 非 生物 大 分 子 体 系 ， 如 有 机 或 无 机 高 分 子 材 料 。GROMACS 主要 是 用 
来 研究 分 子 体系 的 动力 学 性 质 ， 它 可 以 用 分 子 动 力学 、 随 机 动力 学 或 者 路 征 积 分 方法 模拟 溶 
液 中 分 子 热 动 力 的 性 质 ， 进 行 分 子 能 量 的 优化 、 构 象 分 析 等 。GROMACS 支持 很 多 算法 ， 而 
且 与 其 他 动力 学 模拟 软件 相 比 还 具有 其 独特 的 优势 。 

O 为 了 提高 计算 能 力 ，GROMACS 的 设计 者 们 对 算法 进行 了 大 量 的 优化 ， 使 得 它 成 为 
目前 主流 的 分 子 动力 学 模拟 软件 之 一 。 但 是 要 特别 强调 的 是 ，GROMACS 大 大 地 提高 了 计算 
速度 ， 同 时 并 不 以 牺牲 计算 精度 为 代价 。 

2) GROMACS 的 用 户 界 面 设计 非常 人 性 化 ， 而 且 操作 简单 、 功 能 丰富 ， 对 于 初学 者 来 
说 易于 上 手 。 同 时 拓扑 文件 和 参数 文件 都 以 文档 的 形式 给 出 ， 便 于 编辑 .在 程序 运行 过 程 中 ， 
并 个 用 输入 脚本 注释 语言 。 而 且 运 行 的 过 程 是 分 步 进行 的 ， 可 以 随时 检查 模拟 的 正确 性 和 可 
行 性 ， 有 效 地 减少 了 时 间 的 浪费 。 

(8) GROMACS 的 轨迹 存储 来 用 了 损耗 压强 的 方法 ， 这 一 点 相 比 于 同类 的 动力 学 模拟 软 
件 有 很 大 的 区 别 ， 可 以 为 使 用 者 提供 了 一 个 压缩 性 很 强 的 轨迹 数据 文件 ， 并 且 压 缩 的 精度 可 
以 由 用 户 来 选择 。 

由 GROMACS 源码 公开 ， 是 一 个 很 好 的 开源 动力 学 模拟 软件 。 

FHE. Unix/Linux 版 的 GROMACS 软件 为 例 ， 讲 解 其 安装 、 使 用 以 及 分 析 等 具体 
操作 。 


二 、GROMACS 的 下 载 及 安装 

本 实验 以 Redhat Advanced Server 4 Update 7 操作 系统 为 例 来 讲述 GROMACS-3.3.3 
的 安装 及 运行 过 程 。 所 需 文件 : 人 fw-3.0.2.tar.gz 和 gromacs-3.3.3.targz。 

系统 要 求 ; C 编译 器 和 Fortran 编译 器 。 由 于 GROMACS 在 编写 的 时 候 用 到 了 Rw 函数 
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Q 到 http//wwwfftw.org/ 下 载 FFTW 的 源 代码 。 
行 以 下 命令 解压 缩 并 进行 编译 安装， 


$ tar -Xzvf fftw-3 02 „tar.gz 
$ cd fftw-3.0.2 
$./configure --enable-float —enable-threads —prefix=$HOME/gromacs/fftw-3.0.2 


$ make install | 
然后 把 以 下 两 行 写 在 当前 用 户 目录 下 的 bashre 文件 中 ， 保 存 退 出 并 运行 “bash 

$ export CPPFLAGS=-I$SHOME/gromacs/fftw-3.0.2/include 

$ export LDLAGS=-L$HOME;/gromacs/fftw-3.0.2/lib 

fftw 安装 完毕 ， 紧 接着 安装 GROMACS。 

(8) 到 http://www.gremacs.org/ 下载 GROMACS 的 源 代 码 , 这 里 以 GROMACS-3.3.3 为 例 。 
D 执行 以 下 命令 解压 缩 进 行 编 详 安装 : 

$ mkdir -p $HOME/gromacs/gromacs-3.3.3 


vf gromacs-3.3.3.tar.gz 


到 现在 就 已 经 安装 成 功 了 ，GROMACS 被 安装 在 指定 的 SHOME/gromacs/grom-acs- 
333 目录 中 。 然 后 把 下 面 这 一 行 写 在 当前 用 户 目 录 下 的 bask 
行 “bash”, 


文件 中 ， 保 存 退 出 并 运 


三 、GROMACS 的 基本 操作 
在 介绍 GROMACS 的 基本 操作 之 前 , 有 必要 首先 对 GROMACS 中 的 一 些 常用 文件 类 型 
进行 介绍 。 Нар нк 这 是 GROMACS 的 分 子 拓扑 文件 (top бе), Fj 
CS ËB: B) Ama gmx” 可 以 自动 将 PDB 格式 文件 转化 生成 top ЖЇЗ. @ 
molec EANGI pdb 和 go 丙种 用 “pdb2gmx” 将 pdb 文件 转化 
为 op 文件 的 同时 也 可 以 将 pb 转化 为 go ХК. gro 和 pdb 都 是 结构 文件 ， 它 们 的 不 同 在 于 
ro 文件 除了 保存 原子 的 坐标 外 ， 还 可 ү ШШ T F. ЖЫН А. 
关于 模拟 中 的 盒子 信息 ， 主要 是 通过 GROMACS 的 另外 一 个 子 程序 “genbox ”来 加 入 的 。 凶 
nolec amics parameter files (mdp)，mdp 文件 其 实 是 一 个 参数 文件 ， 包 括 了 要 做 分 子 动 
所 所 需 的 参数 例如 时 间 、 步 数 、 温度 压力 、 速 度 等 。(Dindex Шев(ікіх), GROMACS 
的 家 引文 件 即 index 文件 ， H таке ndx 子 程序 生成 , 文件 后 缀 为 ndx。 索 引文 件 是 GROMACS 
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非常 重要 的 文件 н een кыйк naga pio 比如 想 做 
党 的 六 。 于 是 就 E 对 模拟 系统 进行 分 割 定义 的 问题 ， 这 时 索引 文件 就 

要 发 挥 作用 了 。 大 体 的 思路 是 ， 在 索引 文件 中 ; 另外 定义 一 个 单独 的 组 ， 该 组 中 包括 需要 用 
量子 力学 处 理 的 所 有 原子 。 在 тар 文件 中 ， 对 这 个 组 定义 用 量子 力学 来 模拟 。 有 具体 的 信息 可 
以 参考 GROMACS 的 使 用 说 明 。@@run input file (рг), Н GROMACS 的 子 程序 grompp 将 上 
面 提 到 的 四 各 文件 合 开 生 成 ый н» 该 文件 包括 了 分 子 动力 学 模拟 所 需要 的 所 有 信息 。 
traiactory 就 是 动力 学 模拟 时 所 生成 的 轨迹 文件 , 它 记 录 了 模拟 过 程 中 一 定时 间 间 
隔 的 岂 时 结构 信息 ， 它 可 以 用 GROMACS 中 的 子 程 朋 “ngmx” 来 读 取 ， 当 然 也 可 以 用 另外 
一 个 叫做 VMD 的 软件 读 取 。 读 取 之 后 ， 可 以 像 看 电影 一 样 观察 结构 随时 间 的 变化 状况 。 

GROMACS 进行 分 子 动力 学 模拟 大 致 可 以 分 成 以 下 5 个 操作 步骤 : 初 如 文件 的 准备 ; 
初始 结构 的 优化 ， 分 子 动力 学 模拟 ;结果 分 析 。 

接 下 来 以 GID1 蛋白 (pdb 编号 为 ， 2ZSH) 为 例 对 GROMACS 的 操作 步骤 这 
介绍 ， 把 GID1 的 pdb 文件 名 命名 为 complex.pdb。 

1. 初始 文件 的 准备 

Q) 将 pdb 文件 转换 生成 GROMACS 的 结构 文件 (*.gro) 和 拓扑 文件 (*.top), 执行 以 下 
шм” 


pdb2 | | Xpdb —o сотріех.рто -p complex su ax log 
在 进行 分 子 动力 学 模拟 之 前 必须 建立 分 子 的 拓扑 文人 F. 3217 pdb2gmx 后 会 要 求 用 户 
选择 合适 的 分 子 力 场 (El 7-26), 关于 力 场 的 选择 可 以 参考 GROMACS 手册 中 相关 的 章节 。 
这 一 步 将 会 由 原始 的 pdb 文件 得 到 结构 文件 以 及 相应 的 拓扑 文件 ， 二 者 都 可 以 使 用 文本 编辑 
进行 查 : 看 «ШТА лыннан, PDB 文件 都 不 ЖАНа, р pdb2gmx 可 以 添 
ЛЕН kak h У. Hi LACS 结构 文件 中 ， 包 含 了 蛋白 质 结构 的 每 
AT, "ww eet 文件 后 缀 名 为 gro。pdb2gmx.log 是 pdb2gmx fr 
令 输 出 文件 。 此 外 ， 还 1 дз тинч хт 被 称 为 “索引 文件 ” 对 于 pdb2gmx 程序 的 其 


Opening library file /data2/soft/gromacs-4.0.2/share/gromacs/top/FF. dat 


Select the Force Field: 

: GROMOS96 43а1 force field 

: GROMOS96 43a2 force field (improved alkane dihedrals) 

: GROMOS96 45a3 force field (Schuler JCC 2001 22 1205) 

: СЕОМО596 53а5 force field (JCC 2004 vol 25 pag 1656) 

: GROMOS96 53a6 force field (JCC 2004 vol 25 pag 1656) 
OPLS-AA/L all-atom force field (2001 aminoacid dihedrals) 
[DEPRECATED] Gromacs force field {see manual) 
[DEPRECATED] Gromacs force field with hydrogens for NMR 

: Encad all-atom force field, using scaled-down vacuum charges 
: Encad all-atom force field, using full solvent charges 


ш CD ~ On Un b Q ы F с) 


7-26 运行 pdb2gmx 命令 后 的 示意 图 


@ 在 水 箱 中 对 分 子 进行 溶剂 化 。 由 于 实 际 状况 下 所 要 模拟 的 蛋白 奈 的 行为 都 是 在 水 深 
液 中 发 生 的 , 所 以 模拟 之 前 , 必须 给 分 子 添加 水 环境 。 75 中 i : | 
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和 genbox 两 个 子 程序 实现 。 前 者 用 来 生成 一 个 包 囊 整 个 分 子 的 长 方 体 空 箱 ， 后 者 则 会 读 取 结 
构 文 件 并 向 其 中 加 入 水 。Genbox MAA GROMACS 的 结构 文件 ， 并 读 入 水 盒子 尺寸 的 大 
小 ， 输 出 文件 包含 分 子 文件 和 水 盒子 。 同 时 genbox 更 改 原 来 的 拓扑 文件 ， 使 其 包含 水 分 子 。 
在 使 用 genbox 之 前 ， 要 使 用 editconf 命令 定义 水 盒子 大 小 ， 执 行 以 下 命令 ; 

editconf -f complex.gro -o complex.gro -bt octahedron -c -d 0.8 > genbox.log 

“-d 0.8” 指 的 是 从 蛋白 质 边缘 到 盒子 边缘 的 距离 是 0.8nm, 大 约 是 8А, 一 般 来 说 在 0.5 一 

0.8。“-c” 指 的 是 将 蛋白 质 放 在 盒子 的 中 央 。 特 别 要 注意 的 是 ，editconf 这 个 子 程序 也 可 以 用 
来 将 gro 文件 转化 成 pdb 文件 (相当 于 amber 中 的 ambpdb 命令 ): 

editconf -f file.gro -0 file.pdb 

接着 运行 以 下 命令 同 盒 子 中 加 入 水 分 子 : 

genbox -cp complex.gro -cs spc216.gro -p complex.top -o complex_wat.gro >> genbox Іор 

genbox 还 会 修改 相应 的 top 文件 ， 执 行 : 

tail complex.top 

即 可 看 到 genbox 加 入 的 溶剂 分 子 的 数目 。 

原则 上 讲 , 到 此 为 止 已 经 可 以 开始 进行 模拟 计算 了 。 但 是 , 在 准备 模拟 初始 文件 的 时 候 ， 
体系 中 有 很 多 原子 距离 太 近 ， 局 部 能 量 过 高 。 这 些 相互 距离 太 近 的 原子 大 多 是 由 于 genbox 
程序 产生 的 ， 溶 剂 分 子 与 蛋白 分 子 之 间 存 在 不 稳定 的 高 能 量 。 如 果 现 在 开始 模拟 计算 ， 而 不 
进行 能 量 最 优化 ， 系 统 将 可 能 很 不 稳定 。 能 量 最 优化 过 程 是 改变 系统 中 局 部 高 能 量 的 原子 的 
位 置 ， 降 低 这 些 点 的 能 量 。 

2. 初始 结构 的 能 量 最 优化 

在 进行 能 量 最 优化 之 前 ， 先 用 GROMACS 的 预 处 理 程序 grompp 处 理 所 有 输入 文件 。 
grompp 预 处 理 拓扑 文件 〈top)、 坐 标 文件 Cgo) 和 一 个 参数 文件 (mdp)， 然 后 输出 一 个 二 


能 量 最 优化 和 动力 学 模拟 。 这 里 给 出 了 一 个 进行 结构 优化 的 тар 参数 文件 ， 其 中 所 涉及 的 相 
关 项 的 解释 可 以 见 附录 或 者 参考 GROMACS 的 手册 。 运 行 以 下 命令 : 
grompp -v -f em.mdp -c complex wat.gro -p complex.top -0 em.tpr 


cpp = /usr/bin/cpp 
define =-DFLEX SPC 
constramts = попе 
integrator = steep 
nsteps = 5000 

emtol = 10.0 

emstep = 0.01 

nstlist = 10 

ns type = grid 
:Using PME 
coulombtype = PME 
rlist = 0.9 
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rcoulomb = 0.9 

rvdw = 0.9 

рте order = 4 

fourierspacing = 0.12 

fourier пх = 0 

fourier пу = 0 

founer nz = 0 

ewald по] = 1е—5 

optimize Ж = yes 

有 了 二 进 制 拓扑 文件 ， 现 在 可 以 开始 进行 能 量 最 优化 了 。 进 行 能 量 最 优化 的 程序 是 
mdnm， 这 也 是 GROMACS 的 核心 程序 ， 所 有 的 模拟 都 是 用 mdrun 程序 进行 的 ， 就 好 像 
GROMACS 的 心脏 一 样 ， 类 似 于 amber 软件 中 的 sander 程序 。 不 过 在 进行 优化 之 前 还 有 一 件 
非常 重要 的 事情 ， 就 是 要 首先 向 体系 中 加 入 抗衡 离子 来 使 体系 达到 中 性 ， 因 为 所 要 模拟 的 生 
物体 系 中 的 某 些 变化 一 般 都 是 在 接近 中 性 的 条 件 下 发 生 的 。 这 里 所 研究 的 体系 显 负电 性 ， 因 
此 需要 加 入 钠 离 子 来 使 其 达到 电 中 性 。 运 行 以 下 命令 : 

genion -s em.tpr -0 complex wat ion.gro -mame Na -np 2 -p complextop -g 
complex_wat ion.log 

完成 后 ， 就 可 以 进行 能 量 最 优化 了 。 在 进行 能 量 最 优化 过 程 中 ,注意 查看 mdrun 程序 的 
输出 文件 。 在 输出 文件 当中 ，Step 是 模拟 步 数 ，Time 是 模拟 时 间 ，Energies 是 系统 的 各 种 能 
量 值 (图 7-27)。 如 果 模 拟 顺 利 ， 可 以 看 到 系统 势能 从 一 个 很 高 的 值 迅速 降低 ， 最 后 稳定 在 
一 个 较 低 的 值 。 运 行 以 下 命令 : 

mdrun -v -s em.tpr -0 em.trr -с em.gro -e em.edr -g em.log 


Step Time Lambda 
4 4.00000 0.00000 


Energies (kJ/mol) 
Bond Angle Proper Dih. Improper Dih. LJ-14 
6.86825e+03 2.392BBe+03 1.00113e+03 3.01632e+02 .433856+03 
Соціоть-14 LJ (SR) Coulomb (SR) Coul. recip. Potential 
3.53141e+04 1.54032e+05 -8. 33652e+05 -1.33460e+05 -7.52767е%05 
Pressure (bar) 
2.4B345e+04 


Step Тіте Lambda 
5 5, 00000 о. 00000 


Energies (kJ/mol) 
Bond Angle Proper Dih. Improper Dih. LJ-14 
4.95299e+03 2,67851е+03 9. 98294е+02 2.33302е+02 . 05909е+03 
Coulomb-14 LJ (SR) Coulomb (SR) Coul. кесір. Potential 
3.53769e+04 1.52205е+05 -8.36492е+05 -1.338026%05 -7.697190е%05 
Pressure (bar) 
2.427839e+04 


Bs 


图 7-27 (ЖЖНЕВ 
优化 最 后 一 共 可 以 得 到 4 个 文件 ， em.gro、em.tr、em.log 和 em.edr。 第 一 个 是 优化 后 得 


到 的 结构 文件 ， 第 二 个 是 优化 得 到 的 轨迹 文件 ， 第 三 个 是 优化 的 记录 文件 ， 最 后 一 个 则 是 系 
统 能 量变 化 。 在 这 里 可 以 运行 editconf 程序 将 gro 文件 转化 为 pdb 文件 ， 并 用 三 维 结构 可 视 
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化 软件 ， 比 如 pymol 或 VMD А. pdb 文件 ， 来 查看 优化 后 分 子 的 构象 。 运 行 命令 :editconf 


-f em.gro -0 em.pdb 
3. 水 平衡 分 子 动 力学 模拟 


能 量 最 优化 之 后 ， 首 先 保持 蛋 自 质 不 动 ， 对 蛋白 质 周围 水 环境 进行 动力 学 模拟 ， 该 过 程 
КОРИНИЗ) 750 (position restrained MD)， 也 叫 水 平衡 分 子 动力 学 模拟 。 即 保持 
溶剂 分 子 进行 平衡 计算 ， 这 样 做 的 目的 是 为 了 填补 溶剂 空洞 ， 这 些 空 沁 


产生 的 原因 是 由 于 genbox 程序 加 溶剂 不 均匀 造成 的 。 这 时 就 需要 对 相应 的 top 文件 进行 修改 
以 加 入 束缚 条 件 。 发 现在 complex лор 中 有 这 样 几 行 : 
ея f POSRES 


事实 上 这 是 一 个 条 件 包含 语句 ， 仅 仅 当 变 量 poses 的 值 被 设置 时 ， 才 会 包含 posres.itp 
中 的 内 容 ， 关 于 ip 文件 其 实 之 前 也 谈 到 了 它 是 一 个 索引 文件 。 这 样 就 不 需要 修改 top 文件 ， 
使 用 相同 的 top 文件 也 可 进行 自由 状况 下 的 分 子 动力 学 模拟 。 因 此 ， 只 要 在 相应 的 mdp 文件 
中 对 posres 351 二 的 作 过 行 设置 即 可 实现 束缚 状态 下 的 动力 学 优化 。 

接 下 来 要 做 的 是 对 输入 文件 进行 预 处 理 得 到 二 进 制 拓扑 文件 , 这 些 输入 文件 就 是 能 量 最 
优化 得 到 的 输出 文件 。 然后 还 有 一 个 参数 配置 文件 和 索引 文件 。 默认 情况 下 ， 程 序 对 模拟 系 
统 是 分 部 进行 的 。 利用 两 个 部 分 进行 位 置 限制 性 模拟 : Protein 和 SOL 部 分 ， 分 别 表示 和 蛋白质 


和 溶剂 。 在 这 个 过 程 中 ， 即 保持 protein 位 置 不 变 。 参 数 文件 (тар) 包含 了 位 置 限 制 性 模拟 
的 所 有 参数 ， 包 括 步 长 、 步 数 、 温 度 等 。 同 时 参数 文件 告诉 GROMACS 模拟 的 类 型 ， 如 能 
量 最 优化 、 位 置 限制 性 或 者 是 分 子 动力 学 模拟 。 
prmdp 参数 文件 范例 
title ой 


Әйке - _DPOSRES 
constraints = all-bonds 

dt = 0.002 ; ps ! 

nsteps = 20000 ; total 40 ps. 
nstxout = 500 ;collect data every 1 ps 
nstvout = 500 

nstfout = 0 

nstlog = 500 

nstenergy = 500 

nstlist = 10 

ns type = grid 

гїї = 0,9 

coulombtype = PME 
rcoulomb = 0.9 
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rvdw = 0.9 
fourierspacing = 0.12 
fourier nx = 0 
fourier ny = 0 
fourier nz = 0 
pme_order = 4 

ewald | rtol = = le-5 


на 


ёс-ртрѕ = Protein кой 
tau 1=0.1 0.1 
ref t= 300 300 
епегруртрз= Protein Other 


tau p = 0.5 

compressibility = 4.5e-5 

ref f p= 1.0 

: Generate velocites is on at 300 K. 

сеп vel = yes 

gen temp = 300.0 

gen seed = 173529 

同 之 前 的 优化 类 似 ， 运 行 以 下 命令 产生 tpr 文件 : 
ompp -v -f pr.mdp -c em.gro -p complex.top -o ргірг 

然后 运行 : 

ткігип -v -s pr.tpr -0 prtrr -c pr.gro -e pr.edr -g pr.log 

4. ca 


title = md 


nsteps = 500000 ; total 1000 ps. 
nstcomm = 1 
nstxout = 500 ;collect data every 1 ps 
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nstvout = 0 
nstfout = 0 
nstenergy = 500 
nstlist = 10 

ns type = grid 
rlist = 0.9 


pme order = 4 
ewald rtol = 1е-5 
optimize # = уез 


tau t=0.1 0.1 
ref t= 300 300 

Energygrps = Protein 
; Pressure coupling is on 
Pcoupl = berendsen 

tau p= 0.5 


ompressibility = 4.5e-5 

ref p= 1.0 

‚ Generate velocites is on at 300 K. 

gen vel=no 

gen temp = 300.0 

деп seed = 173529 

运行 以 下 命令 产生 tpr 文件 : 

grompp -v -f md.mdp -c pr.gro -p complex.top -o md.tpr 

然后 运行 如 下 命令 ， 到 这 里 真正 的 分 子 动力 学 模拟 就 开始 了 ， 这 个 模拟 一 般 需要 很 长 的 
时 间 。 

mdrun -v -s md.tpr -o md.trr -c md.gro -e md.edr -g md.log 

5， 结 果 分 析 

动力 学 最 重要 的 部 分 不 是 模拟 而 是 分 析 ， 从 模拟 的 轨迹 中 提取 有 用 的 信息 ， 并 加 以 分 析 


第 七 章 ”蛋白 质 结构 的 分 子 动力 学 模拟 | 121 


解释 现象 才 是 最 关键 的 。 在 这 里 主要 把 GROMACS 经 常用 到 的 几 个 分 析 工 具 介绍 给 大 家 。 
动力 学 模拟 做 完 以 后 , 首先 可 以 使 用 GROMACS 的 ngm 程序 观看 动力 学 模拟 轨迹 ( 
7-28)， 轨 迹 文件 包含 了 分 子 动力 学 过 程 的 坐标 、 原 子 速度 和 受 力 情 况 等 。 比 如 某 一 个 动力 学 
模拟 了 大 概 1ns， 就 可 以 用 ngm 来 观察 Ins 的 时 间 段 内 ， 体 系 中 各 个 残 基 的 构象 变化 情况 。 
只 需要 运行 如 下 的 命令 : 
ngmx -s md.tpr -f md.trr 


BCE 


Desk FLA ab ami Sinah 
"Hh nr ep pe 
ага Т EE a hi [Шыр [Їн Ган Гега A ЧИ гын 
їч 


7-28 ngmx 的 运行 界面 


其 实 作 为 一 个 开源 的 分 子 动力 学 软件 ，GROMACS 已 经 提供 了 相当 多 的 分 析 程序 ， 
一 般 来 说 ， 动 力学 模拟 完成 后 要 做 的 第 一 件 事 就 是 看 一 下 该 体系 是 否 达到 了 力 平衡 。 一 般 用 
g rms 这 个 子 程序 来 计算 蛋白 质 中 各 个 部 分 的 RMSD 值 ( 即 均 方 根 偏差 ) 随 模拟 时 间 的 变化 
情况 ， 只 有 当 体 系 的 RMSD 趋 于 稳定 时 ， 动 力学 模拟 才 达到 了 平衡 。 同 时 可 以 配合 xmgrace 
软件 进行 作 图 , 这 样 可 以 更 直观 地 评价 体系 的 平衡 状况 。 例如 利用 g ms 计算 该 体系 (GID1) 
中 骨架 原子 的 RMSD 值 随时 间 的 变化 情况 (图 7-29). 


0 5000 10000 15000 20000 
时 间 /ps 


图 7-9 上 骨架 原子 的 RMSD 随 模拟 时 间 的 变化 情况 
《上 面部 分 是 整个 蛋白 质 的 骨架 ， 下 面部 分 是 蛋白 质 N 端 区 域 的 骨架 ) 
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只 分 析 体系 的 RMSD 值 往往 是 不 够 的 ， 同 时 还 要 其 他 几 款 子 程序 来 评价 体系 的 平衡 状 
况 ， 可 以 利用 g energy 提取 体系 的 势能 随 模 拟 时 间 的 变化 情况 ， 因 为 随 看 模 
体系 趋 于 平衡 ， 往 往 势 能 也 是 趋 于 平衡 的 。 

也 可 以 利用 g dist 和 g bond 评价 某 些 关键 原子 之 间 的 距离 ， 因 为 当 体系 平衡 时 ， 这 些 
关键 的 距离 也 是 趋 于 恒定 的 。g dist 的 index 写法 是 ， 在 里 面 加 入 两 个 group， 内 容 分 别 是 这 
两 个 硕 子 编号 ， 比 如 运行 g dist -f md.xtc -s md.tpr -n index.ndx， 之 后 会 提示 选择 group, rl 
选择 那 两 个 group 就 行 了 ， 结 果 输 出 在 dist.xvg. 

一 般 来 说 ， 当 一 个 体系 的 RMSD 趋 于 稳定 ， 势 能 
稳定 ， 基 本 可 以 断定 该 体系 达到 了 模拟 平衡 ， 可 以 利用 平衡 的 轨迹 过 
介绍 一 些 用 得 比较 多 的 分 析 工 具 。 

g тозе 如 果 想 要 知道 所 模拟 的 蛋白 质 的 各 部 分 的 氨基 酸 残 基 在 动力 学 模拟 过 程 中 随时 
间 的 波动 情况 ， 就 要 用 到 这 个 软件 了 。 通 常 来 说 ， 和 蛋白 质保 守 区 的 波动 性 较 小 ， 问 基 和 loop 
区 的 波动 性 较 大 ， 利 用 该 程序 ， 往 往 可 以 观察 到 和 蛋白质 在 溶液 中 的 某 些 特殊 变化 ， 有 时 也 会 
有 令 人 意 想不到 的 发 现 ， 同 时 该 程序 也 可 以 取 动 力学 一 定时 间 段 内 的 平均 结构 ， 是 一 款 很 不 
错 的 分 析 工 具 。 | 

g gyrate: 可 以 用 来 测量 蛋白 质 回旋 半径 的 变化 ， 和 蛋白 质 的 回旋 半径 反应 了 蛋白质 分 子 
的 体积 和 形状 。 同 一 体系 的 回旋 半径 变 大 ， 说 明 体系 发 生 了 膨胀 。 

g sas: 可 以 用 来 分 析 溶 剂 的 可 及 表面 ， 溶 剂 可 及 表面 是 描述 蛋白 质 琉 水 性 的 重要 指标 ， 
气 基 酸 残 基 的 疏水 性 是 影响 蛋白 质 折 县 的 重要 物理 性 质 。 同 时 体系 的 溶剂 可 及 表面 的 变化 也 
会 影响 溶剂 化 能 。 

do dssp: 可 以 用 来 分 析 蛋 白质 的 二 级 结构 变化 ， 往 往 在 研究 肽 链 折 登 的 分 子 动力 学 时 ， 
要 用 到 这 个 工具 。 

g hbond， 用 来 测量 氧 键 数目 、 距 离 和 角度 随时 间 的 变化 。 

g saltbr: 用 来 分 析 带 电 残 基 之 间 的 盐 桥 的 距离 随时 间 的 变化 。 

g confrms: 此 程序 可 以 将 模拟 的 最 终结 构 与 初始 结构 进行 合 合 比较 ， 用 来 分 析 动 力学 
后 的 结构 与 晶体 结构 的 差异 。 

虽然 GROMACS 带 了 很 多 的 分 析 程 序 ， 但 是 唯一 不 足 的 是 ， 当 模拟 药物 与 重 日 质 之 间 
相互 作用 时 , 缺乏 两 者 之 间 吉 布 斯 结合 自由 能 的 精确 计算 工具 ， 比 如 像 Amber 程序 中 所 带 的 
ММ PBSA。 如 果 想 要 评价 GROMACS 动力 学 模拟 后 药物 的 结合 能 ,就 需要 自己 写 相关 的 肢 
本 程序 来 实现 了 ， 由 于 涉及 比较 深 的 知识 ， 所 以 这 里 不 做 介绍 。 


钨 于 稳定 并 保持 最 低 ， 关 键 距离 保持 
行 深层 次 的 分 析 。 以 下 
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